為何用戶對GPT-4的顯著改善讚譽有加

看來OpenAI正在積極應對針對其GPT語言模型的質疑,特別是關於GPT-4在11月底社交媒體上被批評變得“懶惰”、“愚蠢”以及出現不尋常錯誤的情況。 有猜測認為GPT-4.5可能已經在某些用戶中默默推出,這一點在一些ChatGPT回應中有所暗示。 無論這一理論的真實性如何,最近幾周顯示出GPT-4內部有實質性改進的跡象。

早在上周四,用戶就開始報告GPT-4性能的提升。曾在11月指出GPT-4能力下降的沃頓商學院教授Ethan Mollick,對該模型的效率和回應質量的顯著提升表示贊賞,但並未提供轉向GPT-4.5的證據。他在依賴代碼解釋器進行修正後,形容這一變化為“截然不同”,與他之前認為GPT-4“不可靠且有點乏味”的經歷形成鮮明對比。

同時,OpenAI也在上周三重新開放了ChatGPT Plus的訂閱,這是在自11月14日以來暫停註冊之後。在X上的一則貼文中,Altman承認用戶的耐心等待,以便獲取更多GPU。 雖然還不清楚ChatGPT Plus的重新開放與GPT-4的改進之間是否存在直接關聯,但這一時機頗具故事性。在OpenAI首屆開發者日後不久,訂閱就已經停止,而該活動介紹了幾項針對AI聊天機器人高級版的新功能。由於開發者日後的註冊人數超出處理能力,該公司實施了ChatGPT Plus的候補名單。

用戶之前的投訴曾強調GPT-4的問題,通常它會提供執行命令的解釋,而不是完成任務。在這些投訴之後,出現了GPT-4行為異常的報導,這與用戶習慣的AI特徵大相徑庭。一個常見問題是GPT-4會“反駁”用戶,或者在執行請求之前需要多次澄清。另一個普遍的抱怨是它傾向於解釋而非執行命令。

GPT-4性能的下降可以追溯至至少七月,有研究顯示從三月到六月其準確率顯著下降。許多人,包括OpenAI產品副總裁Peter Welinder,提出答案質量感知不足可能源於心理效應,隨著模型的進一步更新而出現。一些用戶建議調整查詢以獲得更好的結果。

儘管OpenAI對其內部發展保持相對沉默,但Altman關於GPU的貼文可能是持續變化的重要指標。四月的報導指出,OpenAI在2023年剩餘時間內維持商業表現需要超過30,000個GPU單位,即使在11月看到興趣激增之前。

對GPT-4.5的猜測不斷升溫,部分原因是洩露的潛在新版本細節。@therundownai通訊社的創始人Rowan Cheung在X上分享了與此開發相關的價格信息和進階多模態能力。當Cheung詢問這些細節的真實性時,Altman僅簡單回答:“不。”

有關GPT-4.5的猜測始於一張顯示新模型特徵和價格的圖片,但Altman駁斥這一傳聞為無根據。然而,相信自己遇到更新的用戶則表示他們正在體驗GPT-4.5,並引用其性能優越。一些用戶甚至詢問聊天機器人其模型,得到了“GPT-4.5 Turbo”的回答。這使許多人推測OpenAI可能主要通過其移動應用進行GPT-4.5的beta測試。然而,並非所有用戶都能重現這些發現,通常被告知他們正在使用標準的GPT-4。OpenAI員工Will Depue稱這些變化為“非常奇怪且奇異的一致幻覺”。

Cheung指出官方ChatGPT X頁面的一則帖文,貼文中包含描繪大腦和雲朵的表情符號,他解釋為OpenAI對幻覺現象的微妙承認。值得注意的是,OpenAI對付費用戶,如ChatGPT Plus、開發者API用戶和企業客戶提供早期訪問。考慮到這些用戶通常是首批測試新GPT版本和功能的,那些實驗模型性能的用戶很可能擁有某種形式的開發者API訪問。

即使OpenAI目前正在測試GPT-4.5,但任何官方更新的時間表仍然不明,特別是在公司近期經歷組織挑戰的期間。隨著產品的不斷演變,顯然使用中的任何“版本”可能不如實質性進步來得重要。

Most people like

Find AI tools in YBX