Meta的Llama 3.2正式推出：目標直逼OpenAI和Anthropic

Home AI新聞 Meta的Llama 3.2正式推出：目標直逼OpenAI和Anthropic

Meta 的 Llama 3.2：多模態 AI 新時代

在今日的 Meta Connect 活動上，Meta 公布了 Llama 3.2，這是其首個重大視覺模型，整合了圖像和文本的理解能力。Llama 3.2 提供小型和中型模型（11B 和 90B 參數），以及針對移動和邊緣設備優化的輕量級文本專用模型（1B 和 3B 參數）。

Meta CEO 馬克·扎克伯格在主題演講中表示：「這是我們首個開源的多模態模型，它將啟用許多需要視覺理解的應用。」類似於其前身，Llama 3.2 提供長達 128,000 個標記的上下文長度，能夠輸入大量文本，相當於數百頁教科書。更高的參數數量通常能增強模型的準確性及處理複雜任務的能力。

Meta 今天還推出了官方 Llama 堆疊發行版，使開發者能夠在本地、設備、雲端和單節點設置中利用這些模型。祖克柏指出：「開源選項是最具成本效益、可定制和可靠的選擇。我們已達到行業的轉折點，這將成為與 AI 相關的標準，就像 Linux 一樣。」

與 Claude 和 GPT-4o 競爭

在推出 Llama 3.1 兩個多月後，Meta 報導其能力增長了十倍。祖克柏表示：「Llama 繼續快速進步，解鎖了越來越多的功能。」

Llama 3.2 中最大的兩個模型（11B 和 90B）現在支援圖像使用性，能解釋圖表，生成圖像標題，並從自然語言提示中識別物體。例如，用戶可以查詢公司銷售高峰月份，模型能夠利用可用圖形推斷出答案。更大的模型可以從圖像中提取信息以創建詳細的標題。

輕量模型則便利用於開發私人化應用，例如總結近期通訊或管理會議邀請。Meta 表示 Llama 3.2 在圖像識別和視覺理解任務上與 Anthropic 的 Claude 3 Haiku 及 OpenAI 的 GPT-4o-mini 競爭，並在指令遵循、摘要、工具利用及提示重寫方面優於 Gemma 和 Phi 3.5-mini。

Llama 3.2 模型可在 llama.com、Hugging Face 和 Meta 的合作平台下載。

擴展業務 AI 與吸引消費者功能

Meta 也在增強其業務 AI，讓企業能夠在 WhatsApp 和 Messenger 上使用點擊訊息廣告，並開發能回答常見問題的代理，討論產品詳情以及完成購買。公司報導超過 100 萬名廣告商正在使用其生成式 AI 工具，過去一個月創建了 1500 萬則廣告。使用 Meta 生成式 AI 的廣告活動平均提高了 11% 的點擊率和 7.6% 的轉換率。

對於消費者而言，Meta AI 正在獲得「聲音」，包括多位名人的聲音，如朱迪·丹奇、約翰·塞納、基根·邁克爾·基、克里斯汀·貝爾和 Awkwafina。祖克柏表示：「我相信語音將成為與 AI 互動的更自然方式，這樣實在好太多了。」

該模型可以用名人的聲音在 WhatsApp、Messenger、Facebook 和 Instagram 等平台上響應語音或文本命令。Meta AI 還將響應分享的照片，具備編輯圖片、添加或修改背景的能力。此外，Meta 還在探索新的翻譯、視頻配音和口型同步工具。

祖克柏重申，Meta AI 將成為全球最廣泛使用的助理，他聲稱：「它可能已經達到這個地步。」

人人皆可運用AI：Meta的「Llama Stack」如何簡化企業採用

谷歌透過 Gemini 1.5 快速升級，強化企業聯絡中心功能

Most people like

GitMind Chat

1.5M

在當今快速變化的數位世界中，人工智慧助手可以顯著提升生產力並簡化日常生活。無論您需要協助管理行程、尋找資訊，還是提高創造力，理想的人工智慧助手隨時在您指尖，準備以多種方式支持您。探索這項創新技術如何改變您的工作、生活以及與他人的聯繫方式。讓我們一起了解您終極人工智慧助手的好處和功能！

AI 助手 AI Chatbot

Frontly

38.1K

在當今快節奏的數位環境中，人工智慧驅動的無程式碼應用開發使個人和企業能夠在不需要深入編程知識的情況下創建應用程式。這種創新的方法利用人工智慧簡化開發過程，使使用者能夠快速且高效地構建、部署和自訂應用程式。隨著組織追求敏捷性和成本效益，擁抱具備人工智慧功能的無程式碼平台對於在不斷演變的市場中保持競爭力變得至關重要。探索這項變革性技術如何顛覆您的應用創建旅程。

人工智慧 AI Analytics Assistant

Rev AI

130.9K

發現一個準確的語音轉文字API的強大功能，專為將音頻和視頻文件轉換為書面文字而設計。我們的尖端技術確保無縫轉錄，讓準確捕捉口語內容變得比以往更簡單。無論您正在處理採訪、播客或其他多媒體錄音，我們的API都能提供可靠而高效的結果。

語音轉文字API Speech-to-Text

Breakout Learning

10.7K

讓教育工作者充分發揮人工智能的變革力量，創造無與倫比的學習體驗。

人工智慧教育平台 AI Course

Find AI tools in YBX