一年前,就在 OpenAI 推出 ChatGPT 前的兩週,Meta 發布了 Galactica——一個針對科學的開源“大型語言模型”,經過 4800 萬篇科學論文的訓練。Meta 宣稱 Galactica 能夠總結學術文獻、解決數學問題、生成維基文章、撰寫科學代碼,並標註分子和蛋白質。
然而,在 2022 年 11 月 17 日,Galactica 在公開反彈後僅運行三天便遭下架,反對聲音主要源於其產生的不準確且有時具冒犯性的輸出——這一現象被稱為「幻覺」。批評者指出 Galactica 經常產生看似可信但事實上不正確的回應,這讓許多科學界人士感到震驚。
儘管引發爭議,Meta 的首席科學家 Yann LeCun 在社交媒體上為 Galactica 辯護,表示:「不再可能隨便地將其用於娛樂。高興嗎?」然而,該模型未能達到對變革性生成 AI 的預期。
兩週後,ChatGPT 上線。同週,關於 GPT-4 的傳聞浮現,讓參加新奧爾良 NeurIPS 會議的 AI 研究人員充滿期待。11 月 30 日,OpenAI 發布了 ChatGPT,標誌著 AI 領域的一個關鍵時刻,而非 GPT-4。
ChatGPT 迅速顯露出自身的幻覺問題,產生自信卻誤導的回應。OpenAI 在發佈博客中承認這一限制,指出解決此問題是「具有挑戰性的」。儘管存在這些缺陷,ChatGPT 在短短兩個月內用戶數量激增,達到約 1 億月活躍用戶,目前每週用戶已達 1 億。
Galactica 的遺產仍在延續,Meta 也認識到寶貴的教訓。Meta AI 研究副總裁 Joelle Pineau 表示:「我們學到了很多寶貴的經驗……我仍然收到很多希望使用該模型的請求。」她澄清 Galactica 始終是作為研究項目,而非產品。「預期與現實之間的差距過大,」Pineau 注意到該模型的幻覺率低於其他模型,這主要得益於其專注於科學文獻。
在反對聲中,Meta 撤回了 Galactica 的演示,以防止濫用,承認缺乏負責任的使用指南——這一做法已被納入未來的發布中。Pineau 指出如果再來一次,他們會更好地管理受眾期望。「Galactica 的教訓已融入我們下一代模型中。」
下一代模型包括 Llama,這是 Meta 的大型語言模型,在 2023 年 2 月引起了相當大的關注,隨後在 7 月發布了商業版 Llama 2,8 月推出了 Code Llama。Llama 成為首個主要的免費開源大型語言模型,並在 AI 社區引發了持續至今的廣泛辯論。
Llama 在 2 月 24 日推出時,Meta 表現出謹慎。LeCun 強調:「Meta 致力於開放研究,並根據 GPL v3 許可證向研究社區釋出所有模型。」然而,研究人員必須填寫表格才能獲取 Llama 的訪問權,這是基於 Galactica 反彈後的防範措施。LeCun 解釋:「在 Galactica 之後,人們指責我們威脅到了社會的結構。」