OpenAI 推出了 ChatGPT 的新語音功能,使所有用戶,包括免費帳戶的用戶,都能通過語音指令與 AI 互動。這項創新更新允許用戶僅需對應用程式說話,應用程式隨即處理音頻輸入並生成語音回應,從而創造更具互動性的體驗。
最近在 X 的示範中,開發者展示了一個實際情境,以展示語音功能的能力。他們請求 ChatGPT 協助決定在一夜苦戰後要訂多少個披薩,這突顯了這一功能的實用性,使其成為多種對話需求的寶貴工具。
新的語音功能基於 Whisper v3,這是 OpenAI 最新的高級語音識別技術。在最近的 DevDay 活動中首次亮相,Whisper v3 設計旨在提供更高的準確性以及更廣泛的商業應用性,使得用戶能夠更自然地與 AI 溝通。
此前,用戶只能在訂閱 ChatGPT Plus 或 Enterprise 等級時才能使用語音和圖像輸入功能。然而,這一最新發布標誌著向更廣泛的用戶開放這些工具的重要一步,強調了 OpenAI 致力於通過先進技術提升用戶體驗的承諾。
除了語音能力外,ChatGPT 現在還可以將圖像作為提示進行解讀,這是在之前的更新中引入的。這一令人驚嘆的組合提供了一種動態且全面的互動模式,使用戶能夠以更流暢、直覺的方式獲取信息和解決方案。ChatGPT 的持續增強展現了 OpenAI 推動 AI 驅動通信可能性邊界的決心。