今天是人工智慧發展的重要時刻,Meta Platforms(Facebook、Instagram、WhatsApp 和 Oculus VR 的母公司)推出了最新的 Llama 3 大型語言模型(LLM)。這個模型被譽為當前最強大的開源 AI 系統之一,推出時間緊接著其在微軟 Azure 雲服務上的早期泄露。
Llama 3 的初始版本包括兩種型號:一個是 80 億參數模型,另一個是 700 億參數模型,這些參數代表人工神經元之間連結的複雜性。目前,Meta 也在積極訓練一個 4000 億參數的版本,但尚未公布發布日期。根據 Meta 產品副總裁 Ragavan Srinivasan 的說法,這些模型的性能卓越,基準測試能力可媲美主要競爭對手。
目前,Llama 3 的 80B 和 70B 模型在多項任務中表現超越或顯著優於 Google(Gemini Pro 1.5)、Anthropic(Claude 3)和 Mistral(7B Instruct)等競爭模型。特別是 Llama 3 在選擇題和程式碼任務中表現優秀,但在數學文字題和研究生級測驗等特定領域仍有不足。儘管如此,80B 版本在小學數學問題上穩定地超越其他模型。
Meta的Llama 3不僅在基準測試中引起轟動,還驅動了一個新的獨立 Meta AI 聊天機器人,該機器人在網路上可透過 www.meta.ai 訪問。這款聊天機器人直接與 OpenAI 的 ChatGPT、Anthropic 的 Claude 3 和 HuggingFace 的 HuggingChat 競爭。正如 Mark Zuckerberg 所言,「Meta AI 是你可以自由使用的最智能 AI 助手。」
Meta AI 聊天機器人擁有用戶友好的對話介面,可無需 Facebook 登入即可訪問,儘管初期功能可能有限。它還包含一個集成的圖像生成模型 Meta Imagine,允許根據用戶提示近乎實時地創建圖像。用戶需要登錄他們的 Facebook 帳戶才能使用此功能。
與其他平台不同,Meta Imagine 生成的圖像目前不支持調整比例,但提供獨特的水印以表示 AI 生成。用戶可以實時觀看圖像創建過程,並作為動畫或 GIF 重播。
Meta AI 還從微軟的 Bing 和 Google 的搜索結果中獲取即時信息,增強其提供最新回應的能力。然而,目前的 Llama 3 版本缺乏多模態功能,意味著用戶不能上傳圖像或文件進行分析,但 Meta 計劃在未來的更新中解決這個問題。
Llama 3 作為開源模型的一個關鍵特點是,其運行在 Meta 專屬許可下,類似於其前身 Llama 2。雖然第三方企業可以將 Llama 用於商業目的,但每月活躍用戶超過 7 億的企業必須向 Meta 申請許可,這引起了開源社區的批評,可能會限制競爭。
在改進方面,Llama 3 相較於 Llama 2 具有降低的錯誤拒絕率、更好的對齊度及更具多樣性的回應。這些改進源於一個全面的訓練過程,採用了三重平行化策略,使訓練效率提高三倍。Llama 3 的訓練數據超過 15 兆標記,是 Llama 2 的七倍。
70B 版本還具有 8000 標記的上下文窗口,幾乎是其前身的兩倍,能夠處理更長的提示和更全面的信息輸入。Llama 3 目前已可於 Meta 的 AI 網站下載,並在 AWS、Google Cloud 和 Microsoft Azure 等平台上託管。
欲了解更多有關 Llama 3 的資訊,請訪問 Meta 官方 AI 網站。