ChatGPT 高級語音模式:發布日期、兼容性、功能及更多資訊

進階語音模式是ChatGPT的一項創新功能,讓用戶能夠與AI聊天機器人進行即時對話,無需文字提示或冗長的音頻交流。該功能於七月底針對某些Plus訂閱者推出,並在OpenAI的春季更新活動中首次展示。

OpenAI形容進階語音模式為用戶提供「更自然、實時的對話」,並使得用戶可以輕鬆打斷對話。此外,它能夠探測並回應用戶的情感,甚至在聊天過程中進行呼吸停頓和模擬人類的笑聲。如果你尚未獲得訪問權限,請不必擔心——該功能將在不久後擴展至更多用戶。

最近,OpenAI官方向一小部分ChatGPT Plus訂閱者推出了備受期待的進階語音功能,讓某些用戶進行探索。雖然這次初步推出的具體規模尚不明確,但公司承諾在接下來的幾週內擴大訪問範圍,並預計在今年秋季使所有Plus訂閱者全面可用。雖然許多用戶渴望嘗試,但你可以期待在冬季之前獲得訪問,除非發生進一步延遲。收到電子郵件邀請或在ChatGPT應用中看到通知即表示你已獲得訪問權限。

使用進階語音模式的用戶必須擁有Plus訂閱,並且需要使用版本1.2024.206或更高版本的Android設備,或者運行iOS 16.4或更高版本的iPhone及相同版本的應用。值得注意的是,擁有合適的設備並不保證參加alpha測試階段。OpenAI尚未透露遴選用戶的標準,但被選中的用戶將在ChatGPT移動應用中收到電子郵件通知和提示工具以訪問新模式。

在alpha階段,OpenAI將收集使用進階語音模式進行對話的音頻數據,以改善其模型,前提是用戶未選擇退出數據共享。若要禁用此選項,請進入應用設置中的資料控制選項卡,並取消選中「改進所有人的語音」的選項。

OpenAI表示,進階語音的輸入和輸出都有每日使用限制,雖然具體的時間尚未公開,這些限制可能會隨時間變化。然而,像Himels Tech這樣的用戶已經展示了近10分鐘的對話。AI會在距離結束對話三分鐘時通知用戶,並將聊天結束,恢復至標準語音界面。

進階語音模式的核心提供了一種與現有GPT-4o大型語言模型互動的新方式,使用戶能夠將其用於各種任務。本質上,使用進階語音進行的任何操作都可以實現,並通過其有趣的語音特性得到增強。早期用戶正在探索其功能,從打節拍到講故事和快速計數。

然而,進階語音模式也有安全措施和限制。用戶不能在該模式下創建記憶、使用自訂指示或訪問GPT。雖然它可以記住先前進階語音對話的細節,但無法參考通過文字提示或標準語音界面進行的早期聊天。

此外,進階語音無法執行唱歌,無論請求如何。根據OpenAI的說法,「為了尊重創作者的權利,我們實施了多項措施,包括新的過濾器,以防止進階語音模式產生音樂內容,如唱歌。」

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles