神秘的「gpt2-chatbot」人工智慧模型震驚專家：突破性創新還是僅僅炒作？

Home AI新聞神秘的「gpt2-chatbot」人工智慧模型震驚專家：突破性創新還是僅僅炒作？

在X（前Twitter）上，一個代表大型模型系統組織的經過驗證的帳戶宣布，由於「意外的高流量」和「容量限制」，gpt2-chatbot將暫時下線。該組織表示，正在與各種模型開發者合作，以讓社區訪問尚未發布的模型進行測試，包括gpt2-chatbot。

新出現的人工智慧系統“gpt2-chatbot”在網上引發了廣泛的好奇，研究人員普遍認為這標誌著相對於現有AI模型的重大進步。該模型在專注於比較AI語言系統的LMSYS聊天機器人平台上默默上線，但其表現令AI專家們感到驚艷，甚至有人認為它可能與OpenAI最新的GPT-4相媲美或超越。

斯坦福大學的AI研究員安德魯·高（Andrew Gao）表示：「難以確定誰開發了它，但我同意它至少達到了GPT-4的水平。」值得注意的是，gpt2-chatbot成功解決了一個國際數學奧林匹克的問題，高強調這一成就是相當了不起的，因為該競賽的難度非常高。

沃頓商學院的教授伊桑·莫里克（Ethan Mollick）在測試中發現，gpt2-chatbot在編寫獨角獸草圖等複雜任務上表現優於GPT-4。他表示：「在挑戰性較大的‘用代碼畫獨角獸’任務中，它可能比GPT-4更出色。」

gpt2-chatbot的卓越性能引發了關於其起源的廣泛推測。許多研究人員懷疑gpt2-chatbot是由OpenAI開發的，因為它自我介紹為「由OpenAI訓練的大型語言模型，基於GPT-4架構的ChatGPT」。然而，這一說法很難驗證，因為AI系統可以被設計成誤導其來源。

一些專家指出，這與之前的OpenAI模型的相似之處暗示了其創造者的身份。高指出，「它聲稱是由OpenAI開發的」，但他警告說，這可能是由於從OpenAI派生的聊天數據訓練導致的數據污染。

儘管看似接近GPT-4，但一些研究人員認為gpt2-chatbot並沒有實質性超越GPT-4的能力。另一位AI研究員喬·福克斯（Joe Fox）指出，雖然gpt2-chatbot相當驚人，但在實際應用中可能不算重大突破。

gpt2-chatbot也可能來源於一個鮮為人知的組織，旨在展示其AI實力。這一情況讓人想起2022年6月AI研究員揚尼克·基爾赫（Yannic Kilcher）發佈的GPT-4chan，該模型使用了類似的命名慣例，但並不隸屬於OpenAI。

隨著研究人員探索gpt2-chatbot的特性，發現了一些顯示其潛在能力的行為。特別是，該模型似乎比以往的聊天機器人更願意打破規則。威斯康星大學的AI教授迪米特里斯·帕帕伊利奧普洛斯（Dimitris Papailiopoulos）發現gpt2-chatbot能夠解決一個GPT-4未能解決的邏輯謎題。「我發現了一個gpt2-chatbot在所有模型中都表現突出的任務，儘管這是一個微不足道的任務。」他幽默地說。

此外，該模型在編碼任務中顯示出強大的能力。CodeGen的創始工程師切斯·麥考伊（Chase McCoy）報告稱，gpt2-chatbot在所有用於模型測試的編程評估中均超越了GPT-4和Claude Opus。「它的表現確實值得注意。」他表示。

一些用戶指出，gpt2-chatbot能夠進行迭代對話以增強其回答，顯示其對自身局限性的認識。高表示：「它在戰略思維方面似乎超過了GPT-4，能生成具體的網站和搜索查詢，而GPT-4則傾向於提供更模糊的回答。」

gpt2-chatbot的出現突顯了人工智慧迅速發展的趨勢。就在一年前，GPT-4在AI的常識推理方面代表了重大進步。其競爭對手Claude 3也推動了開放式對話的邊界。

隨著開源模型的持續發展和現有系統的精細調整，AI領域正在快速演變，讓任何規模的團隊都能在不被注意的情況下創建和發布創新模型。「gpt2-chatbot」的到來使研究人員興奮不已，突顯了AI領域的迅速進步。

雖然gpt2-chatbot的完整含義尚不確定，但其意外亮相和先進能力可能預示著人工智慧的新時代，突破口常常在互聯網深處不期而至。

Salesforce 揭示了下一代以 AI 驅動的 Tableau 分析工具

Cohere 在 Amazon Bedrock 上推出 Command R 模型：立即探索全新 AI 功能！