中国AI独角兽34亿美元大语言模型超越Llama 2与Falcon表现

01.AI推出Yi-34B:大型语言模型的新竞争者

由人工智能专家李开复领导的中国初创公司01.AI近日发布了Yi-34B,这是一款具备340亿参数的大型语言模型(LLM)。该模型在性能上超越了竞争对手,包括Meta的700亿参数Llama 2和技术创新研究所的1800亿参数Falcon。Yi-34B支持多种语言,包括中文和英文,且可根据不同应用需求进行定制。此外,公司还推出了一款具备60亿参数的小型模型,在标准人工智能/机器学习基准测试中表现良好。

商业化AI解决方案的扩展

成立仅八个月的01.AI已获得“独角兽”地位,计划推出商业产品,以与现有的生成式人工智能领导者OpenAI展开竞争。这一战略与全球日益增长的趋势相吻合,各公司正在开发针对特定市场的生成式AI产品。

迎接AI 2.0时代

01.AI于今年3月成立,致力于引领AI 2.0时代,提升人类生产力,并通过先进语言模型推动经济和社会的重大变革。公司强调AI 2.0的变革潜力,称其将创造出比移动互联网更为广阔的机会,重新定义软件和用户界面。

李开复迅速组建了一支技术团队,成员来自谷歌、华为和微软亚洲研究院等知名企业。公司最初的资金来自创新工场和阿里巴巴云部,具体融资金额未公开。

性能验证与开放研究访问

首次发布的模型包括两种双语模型(60亿和340亿参数),均在4000个tokens的序列上训练,推理时可扩展至32000个tokens。340亿参数的模型在Hugging Face平台上表现优异,在常识推理和阅读理解任务中,分别取得了80.1和76.4的得分,明显优于Llama 2的71.9和69.4的得分。

Yi系列模型为用户提供了高效的解决方案,节省计算资源,同时可以进行经济高效的定制。目前,这些模型已完全开放供学术研究使用,但商业用途需要获得明确许可。

未来创新展望

01.AI的模型为希望在中国提供服务的组织带来了良机,助力双语聊天机器人开发。该初创公司计划扩大开源模型的语言支持,并正在开发一款商业LLM,与OpenAI的GPT系列竞争,尽管相关细节尚未披露。

01.AI是专注于本地化大型语言模型的AI初创公司浪潮中的一部分。百度最近发布了ERNIE 4.0,展示了诸如Qingdu这样旨在与Canva和Adobe Creative Cloud竞争的新应用。与此同时,韩国公司Naver正在推进HyperCLOVA X,以适应韩语和文化环境。印度的Reliance Industries则与Nvidia合作,创建包含该国多种语言的LLM,并用于多种应用场景。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles