今天,Meta Platforms(Facebook、Instagram、WhatsApp和Oculus VR的母公司)推出了Llama 3,标志着人工智能发展的重要时刻。作为最新的大型语言模型(LLM),Llama 3被誉为目前最强大的开源AI系统之一,此次发布正值其在微软Azure云服务上早期泄露后不久。
Llama 3初期推出两个版本:一个是80亿参数模型,另一个是700亿参数模型,这些参数表示人工神经元之间的连接复杂性。Meta目前还在积极开发一个4000亿参数的版本,但尚未公布发布日期。Meta的产品副总裁Ragavan Srinivasan表示,这些模型的表现卓越,其基准能力与主要竞争对手相媲美。
目前,Llama 3的80B和700B模型在多个任务上超越了来自谷歌(Gemini Pro 1.5)、Anthropic(Claude 3)和Mistral(7B Instruct)的竞争模型。具体而言,Llama 3在多项选择题和编程任务方面表现优异,但在数学文字题和研究生水平的测验中略显不足。然而,80B版本在小学数学问题上始终表现超出其他模型的水平。
除了在基准测试中表现出色,Meta的Llama 3还是新独立Meta AI聊天机器人的核心,用户可以在www.meta.ai网站上访问。该聊天机器人直接与OpenAI的ChatGPT、Anthropic的Claude 3和HuggingFace的HuggingChat竞争。正如马克·扎克伯格所言:“Meta AI是您可以自由使用的最智能AI助手。”
Meta AI聊天机器人提供用户友好的对话界面,可无需Facebook登录访问,尽管初期功能可能有限。它包含集成的图像生成模型Meta Imagine,可以根据用户提示实时创建图像。用户需使用Facebook账号登录才能使用该功能。
与其他平台不同,Meta Imagine的图像生成目前不支持生成图像的纵横比调整,但提供独特的水印标识AI生成。用户可以实时查看图像创建过程,并将其回放为动画或GIF。
Meta AI还从微软的Bing和谷歌的搜索结果中获取实时信息,增强其交付最新回应的能力。然而,当前版本的Llama 3缺乏多模态功能,用户无法上传图像或文档进行分析,Meta计划在未来更新中解决此问题。
Llama 3作为开源模型的一个重要特点是采用Meta特定许可证运营,类似于其前身Llama 2。虽然第三方企业可以将Llama用于商业目的,但每月活跃用户超过7亿的企业需要向Meta请求许可证,这引发了开源社区的批评,认为这可能限制竞争。
就改进而言,Llama 3相较于Llama 2在降低错误拒绝率、改善对齐和增强响应多样性方面表现更佳。这一提升源于一次综合训练过程,采用三重并行化策略,训练效率提高了三倍。Llama 3的训练数据量超过15万亿个令牌,是Llama 2的七倍。
700B版本还具备8000个令牌的上下文窗口,几乎是其前身的两倍,能够处理更长的提示和更全面的信息输入。目前,Llama 3可以在Meta的AI网站上下载,并托管在AWS、谷歌云和微软Azure等平台上。
欲了解Llama 3的更多信息,请访问Meta的官方AI网站。