忘掉 ChatGPT:為何 Llama 和開源 AI 在 2023 年主導市場

一隻毛茸茸的駱駝是否能奪得2023年最大的人工智慧故事頭銜?如果我們指的是Meta於二月推出的Llama這一大型語言模型,它徹底改變了人工智慧研究的格局,隨後在七月推出商業版Llama 2,並於八月推出Code Llama,我會說這是有可能的。

我可以已經聽到反對的聲音。“什麼?ChatGPT顯然是2023年最大的人工智慧故事!”人群的叫喊聲幾乎在耳邊響起。“OpenAI的ChatGPT於2022年11月30日推出,到了二月便達到一億用戶!它將生成式人工智慧帶入了流行文化!”

但請聽我說。從我的角度看,ChatGPT無疑是一個生成式人工智慧的遊戲改變者。正如Forrester分析師Rowan Curran所指出的,它是“引爆生成式人工智慧的火花”。

然而,二月是個關鍵時刻,Meta推出了Llama,首個重要的免費“開放源碼”大型語言模型(LLM),引發了整年持續的開放源碼人工智慧熱議。儘管其他科技巨頭、LLM公司及政策制定者對開放源碼人工智慧模型的安全性和安全性進行了審查,並面臨高昂的計算挑戰,但開放源碼人工智慧卻獲得了顯著的進展。

根據Meta的資料,自Llama推出以來,開放源碼人工智慧社區在Hugging Face平台上創建了超過7,000個衍生模型,並產出了如Koala、Vicuna、Alpaca、Dolly和RedPajama等顯著模型。雖然還有其他開放源碼模型,例如Mistral、Hugging Face和Falcon,但Llama是首個獲得大型科技公司數據和資源支持的模型。

ChatGPT或許可以被比作2023年的熱門電影《巴比》,而Llama及其開放源碼對手則像是一個廣闊的漫威宇宙,充滿了承諾對人工智慧格局產生持久影響的衍生作品。

“這一趨勢將引領更多實際且影響深遠的生成式人工智慧應用,進一步鞏固這一領域的開放源碼基礎,”Domino Data Lab數據科學策略及傳教部門主管Kjell Carlsson說。

開放源碼人工智慧的長期影響

以ChatGPT為首的封閉專有模型時代正邁向尾聲。自2015年成立以來的OpenAI,2023年改變了立場。OpenAI聯合創始人Ilya Sutskever向The Verge承認,分享研究是一個錯誤,背後受到競爭和安全問題的驅動。

相比之下,Meta首席人工智慧科學家Yann LeCun倡導商業版本Llama 2的發布,強調大型語言模型是重要基礎設施,需要保持開放。Carlsson承認比較ChatGPT和Llama有些像比較蘋果和橙子,而Llama 2因為其開放源碼性質和商業許可證而具有革命性,能夠進行細微調整和本地部署。

雖然他認可ChatGPT在提高大眾對LLM的認知方面的關鍵性,他認為其基本模型GPT 3.5和4的範疇有限,應主要用於概念驗證。

Otherside AI的首席執行官Matt Shumer指出,Llama的影響可能源自ChatGPT所鋪墊的基礎。他表示:“在過去一年中,有數百家公司因Llama及其後續發展而得以成立。”

前Neeva首席執行官Sridhar Ramaswamy稱讚Llama 2是首個真正有能力的開放源碼人工智慧模型,並將其比作未來雲模型的潛力,其中少數公司可能會壟斷人工智慧技術。但Meta使Llama變得可獲得。

早期的Llama洩漏及其後果

在二月推出的Llama,以其從70億到650億的不同比例模型而脫穎而出。Llama的13B模型在許多自然語言處理基準測試中表現超過GPT-3,其最大模型與PaLM和Chinchilla等一流模型相媲美。最初,Meta向包括斯坦福大學在內的某些學者和研究人員提供了模型權重,以支持其Alpaca項目。

隨著在4chan上的洩漏,全球的開發者都能接觸到一個GPT級別的LLM,這導致了衍生模型的大量激增。在七月,Meta將Llama 2免費提供給商業使用,並由微軟將其整合進Azure雲服務。

這一時刻至關重要,因為關於人工智慧監管的討論日益加劇。六月,美國參議員對Llama洩漏表示擔憂,強調可能會被用於各種有害活動的潛在濫用。

儘管面臨這些挑戰,Meta仍然堅定支持開放源碼人工智慧。在六月的會議上,Mark Zuckerberg強調將生成式人工智慧整合到所有Meta產品中的重要性,並重申公司的“基於開放科學的方法”對人工智慧研究的承諾。

Meta:開放研究的倡導者

Meta一直支持開放研究,特別是通過促進PyTorch框架的生態系統。隨著2023年接近尾聲,Meta將慶祝其根本人工智慧研究(FAIR)倡議成立十周年,該倡議旨在通過開放研究推進公共利益的人工智慧。

Meta的人工智慧研究副總裁Joelle Pineau於2017年加入該組織,因為其對開放科學的承諾,這是她所強調的Meta的核心價值。“我之所以不考慮其他地方而選擇加入,是因為對開放科學的承諾,”她反思道。

但是,Pineau指出開放研究背後的動機已經發生變化。最初的目標是提高研究質量,而近期的發展顯著促進了整個人工智慧生態系統的生產力,賦能了許多擁有替代模型的初創公司。

然而,她警告說,Meta並不保證持續開放發布;每個項目都要經過細致的風險收益分析。

對Llama的反思:精準勝於完美

在參與Llama及其後續版本的Meta FAIR研究科學家Angela Fan強調,Llama模型的創建過程中經過了仔細的準備。“儘管技術仍在發展中,我們可以創造有趣的工具,並在我們的應用程式中實現一致的整合,”她說。

Meta尋求來自開發者社區的持續反饋,並在各種應用中運用Llama,旨在完善未來的版本。

Fan強調Llama開發中準確性及周密準備的重要性。這不僅僅關乎重大的突破;而是關於隨著時間的推進,能有效執行眾多較小的任務。

對開放源碼人工智慧的倡導

Together的聯合創始人Vipul Ved Prakash同意Llama和開放源碼人工智慧是2023年的遊戲改變者的觀點。通過在大型公司和組織的廣泛網絡內部開發高質量模型,有效分配了成本,幫助初創公司減少模型建設費用。

然而,隨著監管機構開始審查開放源碼人工智慧,倡導者強調需要保護對這些模型的訪問。在最近於英國舉行的安全峰會上,對高級人工智慧系統風險的擔憂成為主題。

儘管存在這些擔憂,開放源碼人工智慧倡導者的聯盟,包括LeCun和Google Brain聯合創始人Andrew Ng,發布聲明認為開放人工智慧是“解藥,而非毒藥”。

持續辯論:Llama與ChatGPT

Llama與ChatGPT之間的辯論繼續在專家間引發討論。雖然一些人堅信ChatGPT仍然是今年的主導故事,但另一些人則認為Llama的影響是人工智慧變革的先驅。

RelationalAI的機器學習研究副總裁Nikolaos Vasiloglou強調:“毫無疑問,ChatGPT是遊戲改變者,”這要歸功於其工程和運營效率。TravelAI首席執行官John Lyotier也表示同樣,強調ChatGPT使人工智慧更容易被日常用戶接觸。

相反,Atlas的首席執行官Ben James指出,Llama以ChatGPT所未能達到的方式重新激活了研究與創新,顯示出持久的影響。

最後,兩個模型都豐富了人工智慧的格局。雖然ChatGPT引發了對生成式人工智慧的廣泛興趣,Llama卻有潛力將其未來影響塑造成形。正如Curran所表達的,2023年生成式人工智慧的現象若沒有ChatGPT是無法出現的,但值得注意的是,對創新應用的追求將顯著受益於開放源碼社區。

從長遠來看,專有模型和開放源碼模型將共存。然而,若沒有Llama 2這類廣泛被企業開發者採用的開放源碼模型,生成式人工智慧的領域將會大幅減少進展並過於狹隘。開放源碼社區在推動這一令人興奮領域的重要長期進展中,扮演著至關重要的角色。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles