OpenAI는 고급 음성 모드 기능을 rollout하기 시작했습니다. 이 기능은 선택된 유료 ChatGPT 사용자들이 AI 챗봇과 더 자연스러운 대화를 나눌 수 있도록 설계되었습니다. 2023년 가을까지 모든 ChatGPT Plus 회원들이 이 향상된 도구에 접근할 수 있을 것으로 예상됩니다.
OpenAI는 X에서 고급 음성 모드를 소개하며 "더 자연스럽고 실시간 대화를 가능하게 한다"고 밝혔습니다. 이 모드는 사용자들이 자연스럽게 대화를 중단하고 감정에 따라 반응할 수 있도록 지원합니다. 음성 대화 지원은 9월에 도입되었으며, 고급 버전의 공개 시연은 5월에 진행되었습니다. 새로운 ChatGPT-4o는 음성 상호작용을 위해 단일 멀티모달 모델을 활용하여, 이전의 세 개 모델에 비해 통신을 간소화하고 지연 시간을 줄였습니다.
하지만 초기 시연은 여배우 스칼렛 요한슨의 목소리와 유사하다는 비판을 받았습니다. 그녀는 영화 'Her'에서 AI 캐릭터 사만다의 목소리를 맡았던 바 있습니다. 이러한 논란 이후 고급 음성 모드의 출시는 연기되었고, OpenAI는 해당 성우가 요한슨의 연기를 의도적으로 모방한 것이 아님을 분명히 했습니다. 그 결과, 유사한 음성 옵션은 기능에서 제거되었습니다.