神秘的「gpt2-chatbot」人工智慧模型震驚專家:突破性創新還是僅僅炒作?

在X(前Twitter)上,一個代表大型模型系統組織的經過驗證的帳戶宣布,由於「意外的高流量」和「容量限制」,gpt2-chatbot將暫時下線。該組織表示,正在與各種模型開發者合作,以讓社區訪問尚未發布的模型進行測試,包括gpt2-chatbot。

新出現的人工智慧系統“gpt2-chatbot”在網上引發了廣泛的好奇,研究人員普遍認為這標誌著相對於現有AI模型的重大進步。該模型在專注於比較AI語言系統的LMSYS聊天機器人平台上默默上線,但其表現令AI專家們感到驚艷,甚至有人認為它可能與OpenAI最新的GPT-4相媲美或超越。

斯坦福大學的AI研究員安德魯·高(Andrew Gao)表示:「難以確定誰開發了它,但我同意它至少達到了GPT-4的水平。」值得注意的是,gpt2-chatbot成功解決了一個國際數學奧林匹克的問題,高強調這一成就是相當了不起的,因為該競賽的難度非常高。

沃頓商學院的教授伊桑·莫里克(Ethan Mollick)在測試中發現,gpt2-chatbot在編寫獨角獸草圖等複雜任務上表現優於GPT-4。他表示:「在挑戰性較大的‘用代碼畫獨角獸’任務中,它可能比GPT-4更出色。」

gpt2-chatbot的卓越性能引發了關於其起源的廣泛推測。許多研究人員懷疑gpt2-chatbot是由OpenAI開發的,因為它自我介紹為「由OpenAI訓練的大型語言模型,基於GPT-4架構的ChatGPT」。然而,這一說法很難驗證,因為AI系統可以被設計成誤導其來源。

一些專家指出,這與之前的OpenAI模型的相似之處暗示了其創造者的身份。高指出,「它聲稱是由OpenAI開發的」,但他警告說,這可能是由於從OpenAI派生的聊天數據訓練導致的數據污染。

儘管看似接近GPT-4,但一些研究人員認為gpt2-chatbot並沒有實質性超越GPT-4的能力。另一位AI研究員喬·福克斯(Joe Fox)指出,雖然gpt2-chatbot相當驚人,但在實際應用中可能不算重大突破。

gpt2-chatbot也可能來源於一個鮮為人知的組織,旨在展示其AI實力。這一情況讓人想起2022年6月AI研究員揚尼克·基爾赫(Yannic Kilcher)發佈的GPT-4chan,該模型使用了類似的命名慣例,但並不隸屬於OpenAI。

隨著研究人員探索gpt2-chatbot的特性,發現了一些顯示其潛在能力的行為。特別是,該模型似乎比以往的聊天機器人更願意打破規則。威斯康星大學的AI教授迪米特里斯·帕帕伊利奧普洛斯(Dimitris Papailiopoulos)發現gpt2-chatbot能夠解決一個GPT-4未能解決的邏輯謎題。「我發現了一個gpt2-chatbot在所有模型中都表現突出的任務,儘管這是一個微不足道的任務。」他幽默地說。

此外,該模型在編碼任務中顯示出強大的能力。CodeGen的創始工程師切斯·麥考伊(Chase McCoy)報告稱,gpt2-chatbot在所有用於模型測試的編程評估中均超越了GPT-4和Claude Opus。「它的表現確實值得注意。」他表示。

一些用戶指出,gpt2-chatbot能夠進行迭代對話以增強其回答,顯示其對自身局限性的認識。高表示:「它在戰略思維方面似乎超過了GPT-4,能生成具體的網站和搜索查詢,而GPT-4則傾向於提供更模糊的回答。」

gpt2-chatbot的出現突顯了人工智慧迅速發展的趨勢。就在一年前,GPT-4在AI的常識推理方面代表了重大進步。其競爭對手Claude 3也推動了開放式對話的邊界。

隨著開源模型的持續發展和現有系統的精細調整,AI領域正在快速演變,讓任何規模的團隊都能在不被注意的情況下創建和發布創新模型。「gpt2-chatbot」的到來使研究人員興奮不已,突顯了AI領域的迅速進步。

雖然gpt2-chatbot的完整含義尚不確定,但其意外亮相和先進能力可能預示著人工智慧的新時代,突破口常常在互聯網深處不期而至。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles