為何用戶對GPT-4的顯著改善讚譽有加

Home AI新聞為何用戶對GPT-4的顯著改善讚譽有加

看來OpenAI正在積極應對針對其GPT語言模型的質疑，特別是關於GPT-4在11月底社交媒體上被批評變得“懶惰”、“愚蠢”以及出現不尋常錯誤的情況。有猜測認為GPT-4.5可能已經在某些用戶中默默推出，這一點在一些ChatGPT回應中有所暗示。無論這一理論的真實性如何，最近幾周顯示出GPT-4內部有實質性改進的跡象。

早在上周四，用戶就開始報告GPT-4性能的提升。曾在11月指出GPT-4能力下降的沃頓商學院教授Ethan Mollick，對該模型的效率和回應質量的顯著提升表示贊賞，但並未提供轉向GPT-4.5的證據。他在依賴代碼解釋器進行修正後，形容這一變化為“截然不同”，與他之前認為GPT-4“不可靠且有點乏味”的經歷形成鮮明對比。

同時，OpenAI也在上周三重新開放了ChatGPT Plus的訂閱，這是在自11月14日以來暫停註冊之後。在X上的一則貼文中，Altman承認用戶的耐心等待，以便獲取更多GPU。雖然還不清楚ChatGPT Plus的重新開放與GPT-4的改進之間是否存在直接關聯，但這一時機頗具故事性。在OpenAI首屆開發者日後不久，訂閱就已經停止，而該活動介紹了幾項針對AI聊天機器人高級版的新功能。由於開發者日後的註冊人數超出處理能力，該公司實施了ChatGPT Plus的候補名單。

用戶之前的投訴曾強調GPT-4的問題，通常它會提供執行命令的解釋，而不是完成任務。在這些投訴之後，出現了GPT-4行為異常的報導，這與用戶習慣的AI特徵大相徑庭。一個常見問題是GPT-4會“反駁”用戶，或者在執行請求之前需要多次澄清。另一個普遍的抱怨是它傾向於解釋而非執行命令。

GPT-4性能的下降可以追溯至至少七月，有研究顯示從三月到六月其準確率顯著下降。許多人，包括OpenAI產品副總裁Peter Welinder，提出答案質量感知不足可能源於心理效應，隨著模型的進一步更新而出現。一些用戶建議調整查詢以獲得更好的結果。

儘管OpenAI對其內部發展保持相對沉默，但Altman關於GPU的貼文可能是持續變化的重要指標。四月的報導指出，OpenAI在2023年剩餘時間內維持商業表現需要超過30,000個GPU單位，即使在11月看到興趣激增之前。

對GPT-4.5的猜測不斷升溫，部分原因是洩露的潛在新版本細節。@therundownai通訊社的創始人Rowan Cheung在X上分享了與此開發相關的價格信息和進階多模態能力。當Cheung詢問這些細節的真實性時，Altman僅簡單回答：“不。”

有關GPT-4.5的猜測始於一張顯示新模型特徵和價格的圖片，但Altman駁斥這一傳聞為無根據。然而，相信自己遇到更新的用戶則表示他們正在體驗GPT-4.5，並引用其性能優越。一些用戶甚至詢問聊天機器人其模型，得到了“GPT-4.5 Turbo”的回答。這使許多人推測OpenAI可能主要通過其移動應用進行GPT-4.5的beta測試。然而，並非所有用戶都能重現這些發現，通常被告知他們正在使用標準的GPT-4。OpenAI員工Will Depue稱這些變化為“非常奇怪且奇異的一致幻覺”。

Cheung指出官方ChatGPT X頁面的一則帖文，貼文中包含描繪大腦和雲朵的表情符號，他解釋為OpenAI對幻覺現象的微妙承認。值得注意的是，OpenAI對付費用戶，如ChatGPT Plus、開發者API用戶和企業客戶提供早期訪問。考慮到這些用戶通常是首批測試新GPT版本和功能的，那些實驗模型性能的用戶很可能擁有某種形式的開發者API訪問。

即使OpenAI目前正在測試GPT-4.5，但任何官方更新的時間表仍然不明，特別是在公司近期經歷組織挑戰的期間。隨著產品的不斷演變，顯然使用中的任何“版本”可能不如實質性進步來得重要。

研究人員釋放 ChatGPT 的潛力

2023：人工智慧的年度—您必須知道的9個關鍵時刻