OpenAI 將全新 ChatGPT 語音模式的推出延遲超過一個月

Home AI新聞 OpenAI 將全新 ChatGPT 語音模式的推出延遲超過一個月

OpenAI於2024年5月的春季更新活動中推出了GPT-4o和備受期待的ChatGPT語音模式。這項新功能旨在促進與人工智能的自然對話，並具備情感色彩及管理打斷的能力。然而，語音模式的推出已被延遲至少一個月，預計最早將在七月底或八月初才能上線，初期僅限於小部分用戶使用。

OpenAI透過其X帳號宣布了此延遲，表示需要額外時間來完善語音模式。公司強調，模型在檢測和拒絕不當內容的能力上有所提升。聲明中提到：“我們原計劃在六月底向一小部分ChatGPT Plus用戶推出語音模式，但為了達到我們的質量標準，我們需要再多一個月。我們正在增強內容檢測功能，改善用戶體驗，並確保基礎設施能有效擴展，實現實時回應。我們的分階段部署策略涉及在擴大對所有Plus用戶的訪問之前，先收集初始用戶群的反饋，前提是滿足我們的安全和可靠性標準。”

語音模式承諾使人工智能能理解和回應情感與非語言提示，提升對話體驗。OpenAI致力於慎重引入這些進步。

然而，此次延遲對OpenAI來說是一個挑戰，因為它正面臨來自競爭對手如Anthropic的壓力，後者最近推出了Claude 3.5 Sonnet基礎模型，據報導在多項第三方評估中超越了GPT-4o。OpenAI在追求實現人工通用智能(AGI)的過程中，也受到對其安全措施的輿論關注，內部批評聲音針對其限制性分離協議和股權限制，大部分已經有所調整。

外部批評聲音持續不斷，特別是由演員史嘉蕾·喬韓森發起，她對AI語音“Sky”的抗議表示，該聲音在未經她同意的情況下過於相似。OpenAI回應稱，為Sky配音的演員與喬韓森是分開接觸的，不過該公司已經停用了該AI聲音。

儘管面臨這些挑戰，OpenAI仍在吸引新用戶和合作夥伴，包括在創意產業的合作，推出尚未發布的視頻AI模型Sora，並將GPT-4o整合進醫療應用，例如Color的癌症篩檢工具，還獲得了眾多企業客戶。

Udio，這家人工智慧音樂創業公司，針對主要唱片公司的訴訟作出回應：我們的模型並不重複使用受版權保護的音樂。

玩具反斗城推出首個利用 OpenAI 的 Sora 技術打造的廣告影片