01.AI 推出 Yi-34B:大型語言模型新競爭者
中國初創企業 01.AI 由 AI 專家李開復領導,正式推出 Yi-34B,一款擁有340億參數的大型語言模型(LLM)。此模型超越了競爭對手,如 Meta 的 700億參數 Llama 2以及技術創新研究所的 1800億參數 Falcon。
Yi-34B 是多語言的,支持中英雙語,並可針對各種應用進行定制。此外,還提供一款擁有60億參數的小型模型,在標準的 AI/ML 基準測試中表現不俗。
擴展商業 AI 解決方案
自八個月前成立以來,01.AI 已經達到獨角獸地位,計劃推出商業產品,與用戶數量領先的生成式 AI 公司 OpenAI 競爭。這一策略符合全球企業針對特定市場開發生成式 AI 的趨勢。
迎接 AI 2.0 時代
成立於三月的 01.AI 致力於開創 AI 2.0 時代,通過先進的語言模型提升人類生產力,並推動重大的經濟和社會變革。公司強調 AI 2.0 的轉型潛力,預計將創造比移動互聯網十倍的機會,並改變軟件和用戶界面。
李開復迅速組建了一支由來自 Google、華為及微軟亞太研究院的 AI 專家組成的技術團隊。最初的資金來自創新工場和阿里巴巴的雲端部門,但具體資金數額尚未披露。
性能驗證與開放研究訪問
首批發布包括兩款雙語模型(60億和340億參數),均於4000個標記的序列上進行訓練,並可在推理過程中擴展至32000個標記。340億模型在 Hugging Face 等平台上顯示出卓越的性能,超越更大型的競爭對手—在常識推理和閱讀理解任務中取得了80.1和76.4的分數,而 Llama 2 則分別為71.9和69.4。
Yi 系列模型為用戶提供了高效的解決方案,節省計算資源,並允許經濟實惠的定制。目前,這些模型完全開放用於學術研究,但商業使用需明確獲得授權。
未來創新在望
01.AI 的模型為希望服務中國客戶的組織提供了良好機會,促進了雙語聊天機器人的開發。該初創公司計劃在其開源模型中擴大語言支持,並正在開發一款商業 LLM,力圖與 OpenAI 的 GPT 系列抗衡,雖然具體細節尚不明朗。
01.AI 也是 AI 初創企業推動本地化 LLM 的更廣泛運動的一部分。百度最近推出了 ERNIE 4.0,展示了新應用如 Qingdu,一個旨在與 Canva 和 Adobe Creative Cloud 競爭的創意平台。同樣,韓國公司 Naver 也推出了面向韓語及文化背景的 HyperCLOVA X,而印度的 Reliance Industries 則與 Nvidia 合作,創建一款包含多種語言的 LLM,以滿足不同應用的需求。