2024년 5월 OpenAI의 봄 업데이트 이벤트에서는 GPT-4o와 많은 기대를 모았던 ChatGPT의 음성 모드가 소개되었습니다. 이 새로운 기능은 감정적 억양과 중단 관리 능력을 갖추어 AI와의 보다 자연스럽고 대화 같은 상호작용을 추구합니다. 그러나 음성 모드의 출시 일정은 최소 한 달 연기되어, 가장 빠른 시점은 7월 말이나 8월 초로 예상되고 있습니다. 처음에는 소수의 사용자에게만 제공될 예정입니다.
OpenAI는 X 계정을 통해 이 연기를 발표하며 음성 모드를 개선할 추가적인 시간이 필요하다고 밝혔습니다. 회사는 부적절한 콘텐츠를 감지하고 거부하는 모델의 능력을 향상시키고 있음을 강조했습니다.
회사는 “우리는 6월 말에 ChatGPT Plus 사용자들 중 일부에게 음성 모드를 알파 버전으로 출시할 계획이었으나, 품질 기준을 충족하기 위해 한 달이 더 필요합니다. 우리는 콘텐츠 감지 능력을 강화하고 사용자 경험을 개선하며, 실시간 응답을 제공하는 안정적인 인프라를 구축하고 있습니다. 우리의 단계적 배포 전략은 초기 사용자 그룹의 피드백을 수집한 후 가을에 모든 Plus 사용자에게 접근 권한을 확대할 예정입니다. 이는 우리의 안전성과 신뢰성 기준을 충족해야 하는 조건이 있습니다.”라고 전했습니다.
음성 모드는 AI가 감정적 및 비언어적 신호를 이해하고 반응할 수 있도록 하여 대화 경험을 향상하는 데 기여할 것으로 기대되고 있습니다. OpenAI는 이러한 발전을 신중하게 도입할 것을 다짐하고 있습니다.
이번 연기는 OpenAI가 클로드 3.5 소넷 기초 모델을 최근 출시한 경쟁사 Anthropic와의 경쟁에서 도전 과제가 되고 있습니다. 클로드는 여러 제3자 평가에서 GPT-4o를 능가한 것으로 알려졌습니다. OpenAI는 인공지능 일반 지능(AGI) 달성을 위한 안전 조치에 대한 scrutiny에 직면해 있으며, 이로 인해 제한적인 분리 계약 및 주식 한도에 대한 내부 비판도 있었습니다. 많은 조건이 이제 수정되었습니다.
또한, 외부 비판이 이어지고 있으며, 특히 배우 스칼렛 요한슨은 자신의 동의 없이 자신의 목소리와 유사한 AI 음성 ‘스카이’에 대한 항의를 표명했습니다. OpenAI는 스카이의 목소리 배우가 요한슨과는 별도의 접근을 받았다고 해명했으나, 이후 해당 AI 음성을 비활성화했습니다.
이러한 도전에도 불구하고 OpenAI는 새로운 사용자 및 파트너십을 유치하고 있으며, 출시되지 않은 비디오 AI 모델 Sora와의 협업, 컬러의 암 검사 도구와 같은 헬스케어 애플리케이션에 GPT-4o 통합을 통해 많은 기업 고객을 확보하고 있습니다.