忘掉ChatGPT:2023年为啥Llama和开源AI引领潮流

2023年最大的人工智能故事:来自毛茸茸的骆驼与开放源代码的革命

可以说,2023年最大的人工智能故事是由Meta公司的Llama(洛马)引发的。这一大型语言模型于2月份发布,随后在7月推出了商业版本Llama 2,以及8月的Code Llama,彻底改变了人工智能研究的格局。

或许你会反对:“不,ChatGPT才是2023年最大的人工智能故事!”没错,OpenAI的ChatGPT确实在2022年11月30日发布,并在短短几个月内积累了1亿用户,快速进入大众文化。然而,请听我说。

ChatGPT无疑是生成式人工智能的突破口,正如Forrester的分析师Rowan Curran所指出的,它是“点燃生成式人工智能热潮的火种”。但2月份Meta发布Llama,标志着一个重要时刻,首次推出了重大开放源代码大型语言模型(LLM),引发了一场持续整年的关于开放源代码人工智能的激烈讨论。

随着其他科技巨头、LLM公司和决策者对具有开放源代码访问的人工智能模型进行安全性和保障的审查,开放源代码人工智能获得了显著的发展。根据Meta的数据,自Llama发布以来,开放源代码社区在Hugging Face平台上创建了超过7000个衍生模型,涌现出如Koala、Vicuna、Alpaca、Dolly和RedPajama等著名模型。虽然还有其他开放源代码模型,如Mistral、Hugging Face和Falcon,但是Llama是首个获得大型科技公司数据和资源支持的模型。

可以将ChatGPT比作2023年的票房大片《巴比》,而Llama及其开放源代码项目则更像是一个庞大的漫威宇宙,充满了承诺对人工智能格局产生持久影响的衍生故事。正如Domino Data Lab的数据科学策略和传播负责人Kjell Carlsson所说,这一趋势将带来“更具实际影响力的生成式人工智能应用,进一步巩固该领域的开放源代码基础”。

开放源代码人工智能的长期影响

ChatGPT标志着封闭的专有模型时代的开始。OpenAI自2015年作为一个开放研究倡议成立,与2023年的立场变化形成鲜明对比。OpenAI的联合创始人Ilya Sutskever向《The Verge》承认,分享研究是一项出于竞争和安全担忧的失策。

相反,Meta的首席人工智能科学家Yann LeCun则主张推出Llama 2的商业版本,强调大型语言模型是需要保持开放的重要基础设施。Carlsson认可ChatGPT在让公众关注LLM方面的先锋作用,但他指出,其底层模型GPT 3.5和4的功能有限,主要应作为概念验证工具。

Otherside AI的首席执行官Matt Shumer表示,Llama的影响很大程度上源于ChatGPT奠定的基础。他提到:“在过去的一年里,有数百家公司在没有Llama及其后续开发的情况下是无法成立的。”

前Neeva首席执行官Sridhar Ramaswamy称赞Llama 2是第一个真正可用的开放源代码人工智能模型,指出可能会导致少数公司垄断人工智能能力,但Meta使Llama变得可及。

Llama的早期泄露及其后果

Llama于2月发布,以其从70亿到650亿不同参数量的模型而著称。Llama的13B型号在许多自然语言处理基准测试中表现优于GPT-3,其最大模型则与顶级模型如PaLM和Chinchilla相竞争。起初,Meta仅向特定学术界和研究人员提供模型权重,包括斯坦福大学的Alpaca项目。

然而,因在4chan网站上出现泄露,全球开发者迅速获得了这一GPT级别的LLM,随之产生了一波衍生模型。7月,Meta宣布Llama 2免费用于商业用途,微软亦将其集成到Azure云服务中。

这一时刻恰逢AI监管讨论升级。6月,美国参议员对此次Llama泄露表示关切,担心其在各种有害活动中的潜在滥用。

尽管面临这些挑战,Meta重申了对开放源代码人工智能的承诺。在6月份的会议上,马克·扎克伯格强调将生成式人工智能整合到所有Meta产品中的重要性,并重申公司在人工智能研究中坚持“开放科学为本”的理念。

Meta:开放研究的倡导者

Meta一直积极倡导开放研究,尤其是在推动PyTorch框架生态系统方面。2023年即将结束,Meta庆祝基础人工智能研究(FAIR)倡议十周年,旨在通过开放研究推进公共利益。

Meta AI研究副总裁Joelle Pineau在2017年加入Meta,强调其在开放科学方面的承诺是她选择的主要原因。“我之所以没有考虑其他地方,就是因为对开放科学的坚定承诺,”她回忆道。

然而,Pineau指出,开放研究的动机出现了变化。虽然初期目标是提高研究质量,但最近的发展显著促进了整个人工智能生态系统的生产力,并增强了众多初创企业在替代模型上的能力。

她警告称,Meta并不保证每个项目都保持开放发布;每个项目都经过精心的风险与收益分析。

对Llama的反思:准确性重于完美

参与Llama及其后续项目的Meta FAIR研究科学家Angela Fan强调,在创建Llama模型时进行了细致的准备。“尽管技术仍在发展,我们可以创建有趣的工具,并在各个应用程序间实现一致的整合,”她表示。

Meta持续向开发者社区和使用Llama进行各类应用的初创企业寻求反馈,旨在优化未来的版本。Fan强调在Llama的发展过程中,准确性和严谨性至关重要。这不仅关乎突破,更是有效执行无数小任务的综合体现。

对开放源代码人工智能的倡导

共同创办Together并因创建RedPajama数据集而闻名的Vipul Ved Prakash同样认为,Llama和开放源代码人工智能是2023年的颠覆者。通过在庞大的公司和组织网络中开发高质量模型,成本得以有效分摊,有助于初创企业降低模型开发开支。

然而,随着监管者开始对开放源代码人工智能进行审查,倡导者们强调需要保护对这些模型的访问。在最近的英国安全峰会上,高级人工智能系统的风险成为热点话题。

尽管存在这些担忧,一个包括LeCun和Google Brain联合创始人Andrew Ng在内的开放源代码人工智能倡导者联盟发表声明,称开放人工智能是“解药,而不是毒药”。

持续的争论:Llama与ChatGPT

Llama与ChatGPT的争论仍在专家之间激发讨论。尽管一些人坚信ChatGPT依然是这一年的主流故事,但另一些人则认为Llama的影响是未来人工智能变革的前奏。

RelationalAI的机器学习研究副总裁Nikolaos Vasiloglou坚定地表示:“毫无疑问,ChatGPT是一个游戏改变者,”感谢其工程和运营效率。TravelAI的首席执行官John Lyotier也表示赞同,强调ChatGPT使人工智能对普通用户变得可及。

与此同时,Atlas的首席执行官Ben James指出,Llama重振了研究和创新,而这正是ChatGPT未能实现的,暗示了其长远的影响。

最终,这两种模型都为人工智能领域做出了重要贡献。尽管ChatGPT点燃了大众对生成式人工智能的广泛关注,Llama却有望塑造其未来的发展。正如Curran所言,2023年的生成式人工智能现象若没有ChatGPT的引导是难以实现的,而创新应用的推动将主要依靠开放源代码社区。

长远来看,专有模型和开放源代码模型将并存。然而,如果没有像Llama 2这样广泛被企业开发者采纳的开放源代码模型,生成式人工智能的格局将大幅滞后,过于小众。开放源代码社区在推动这一激动人心的领域的长远重大进展中发挥着至关重要的作用。

Most people like

Find AI tools in YBX