OpenAI於2024年5月的春季更新活動中推出了GPT-4o和備受期待的ChatGPT語音模式。這項新功能旨在促進與人工智能的自然對話,並具備情感色彩及管理打斷的能力。然而,語音模式的推出已被延遲至少一個月,預計最早將在七月底或八月初才能上線,初期僅限於小部分用戶使用。
OpenAI透過其X帳號宣布了此延遲,表示需要額外時間來完善語音模式。公司強調,模型在檢測和拒絕不當內容的能力上有所提升。聲明中提到:“我們原計劃在六月底向一小部分ChatGPT Plus用戶推出語音模式,但為了達到我們的質量標準,我們需要再多一個月。我們正在增強內容檢測功能,改善用戶體驗,並確保基礎設施能有效擴展,實現實時回應。我們的分階段部署策略涉及在擴大對所有Plus用戶的訪問之前,先收集初始用戶群的反饋,前提是滿足我們的安全和可靠性標準。”
語音模式承諾使人工智能能理解和回應情感與非語言提示,提升對話體驗。OpenAI致力於慎重引入這些進步。
然而,此次延遲對OpenAI來說是一個挑戰,因為它正面臨來自競爭對手如Anthropic的壓力,後者最近推出了Claude 3.5 Sonnet基礎模型,據報導在多項第三方評估中超越了GPT-4o。OpenAI在追求實現人工通用智能(AGI)的過程中,也受到對其安全措施的輿論關注,內部批評聲音針對其限制性分離協議和股權限制,大部分已經有所調整。
外部批評聲音持續不斷,特別是由演員史嘉蕾·喬韓森發起,她對AI語音“Sky”的抗議表示,該聲音在未經她同意的情況下過於相似。OpenAI回應稱,為Sky配音的演員與喬韓森是分開接觸的,不過該公司已經停用了該AI聲音。
儘管面臨這些挑戰,OpenAI仍在吸引新用戶和合作夥伴,包括在創意產業的合作,推出尚未發布的視頻AI模型Sora,並將GPT-4o整合進醫療應用,例如Color的癌症篩檢工具,還獲得了眾多企業客戶。