OpenAI 最近揭曉了其最新的 AI 大型語言模型(LLM)GPT-4o(Omni),初步反應已經湧現出來。
在這個早期階段,反饋意見不一。雖然一些觀眾在 OpenAI 的 26 分鐘簡報結束後渴望更多,但該公司隨後發布了多個視頻演示及更多信息。GPT-4o 自稱速度更快,對開發者更具經濟效益,並且在檢測和模擬人類情感方面有顯著提升,主要透過音頻功能實現。
該模型對所有 ChatGPT 用戶免費,包括非訂閱者,但付費訂閱者將優先獲得新功能,隨著推出的逐步推進,預計在未來幾周內會全面開放。目前,它支持文本和視覺功能,音頻和視頻功能也將很快上線。
GPT-4o 的設計理念是平等對待文本、音頻和視覺數據,將所有形式轉換為標記。這項創新提高了速度並降低了成本。
專家和影響者對此的反響如下:
Nvidia 高級研究經理 Jim Fan 評論道:“OpenAI 正在搶佔 Character AI 的市場……這是朝向更具情感色彩的 AI 的轉變,而 OpenAI 似乎在過去對此有所抑制。”
Wharton 華頓商學院教授 Ethan Mollick 指出:“GPT-4o 並不是一個大的飛躍,而是這個。”
AI 影響者 Allie K. Miller 對新推出的 macOS ChatGPT 應用感到興奮,表示:“它基本上是你的同事,與你全天候不知疲倦地共享屏幕。我可以想像人們將能長時間使用這個。”
AI 開發者 Benjamin De Kraker 認為 GPT-4o 是朝向人工通用智能(AGI)的一個重要進步,稱:“當一個虛擬‘人’可以聆聽、對話、看和推理,幾乎無法與普通人區分開時,你還能怎麼稱呼它?”
另一位開發者 Siqi Chen 指出,GPT-4o 能夠根據文本創建 3D 對象,他聲稱:“這個事件在回顧時將被認為是 OpenAI 最被低估的時刻。”
相比之下,記者 James Vincent 批評其市場行銷策略,稱其“狡猾”,並警告語音互動並不一定意味著能力的飛躍。
Gartner 副總裁 Chirag Dekate 認為這次揭曉“有些平淡”,將其與數月前的 Google Gemini 演示相比。他指出 OpenAI 與 Google 和 Microsoft 等大型科技公司之間存在日益擴大的“能力差距”,因為這些公司擁有支持其模型的海量數據和基礎設施。
一些反應則更為尖銳;反科技影響者“Artisanal Holdout”批評 GPT-4o 的推出時間表,認為與對 GPT-5 的期待相比顯得不足。
相反,Late Checkout 的首席執行官 Greg Isenberg 認為“變化的速度令人難以置信”,而 AI 教育者 Min Choi 則稱讚此次發布,表示將“徹底改變 AI 助手的遊戲規則”。
雖然 GPT-4o 仍處於初期階段,許多功能尚未推出,但它已經引發了熱烈的反響,顯示出 OpenAI 觸及了重要的市場需求。
請繼續關注我們對新模型的評估,未來幾天將進行測試。