업그레이드된 ChatGPT 아바타가 실시간으로 인간처럼 반응할 수 있는 기능을 공개한 지 며칠 후, OpenAI는 논란이 많은 "Sky" 음성 기능을 일시 중지하기로 결정했습니다. 이 결정은 Sky 음성이 영화 "Her"에서 AI 캐릭터를 연기한 스칼렛 요한슨의 목소리와 너무 유사하다는 우려 때문입니다. OpenAI는 이 음성이 요한슨의 직접적인 모방이 아니라고 반박하며, “다른 전문 여배우가 자신의 자연스러운 목소리로 녹음했다”고 설명했습니다.
Sky 음성이 언제 재도입될지는 불확실하지만, ChatGPT 사용자들은 여전히 Breeze, Cove, Ember, Juniper의 네 가지 대체 음성 옵션 중에서 선택할 수 있습니다. 이 발표 직후, 기자 야샤르 알리는 요한슨의 대리인과의 성명을 공유했으며, OpenAI CEO 샘 올트먼이 새로운 음성 출시에 앞서 요한슨에게 목소리를 요청했지만 거절했다고 밝혔습니다. 요한슨은 데모를 듣고 충격과 실망을 느꼈으며, 그 목소리가 자신의 목소리와 놀라울 정도로 유사하다고 언급했고, 이로 인해 많은 사람들이 혼동을 겪었습니다.
OpenAI는 2023년 9월에 ChatGPT를 위한 음성 기능을 출시했지만, 초기 모델은 오디오를 텍스트로 전사하고 응답을 생성하며 텍스트를 다시 오디오로 변환하는 세 가지 시스템에 의존했기 때문에 상당한 지연이 발생했습니다. 이로 인해 AI는 어조, 여러 화자, 배경 소음에 반응하는 데 어려움을 겪었습니다.
이러한 문제를 해결하기 위해 OpenAI는 최근 GPT-4o를 발표했습니다. GPT-4o는 텍스트, 음성, 비전을 통합한 실시간 다중 모달 AI로, 응답을 약 320밀리초 만에 제공합니다. 이 업그레이드는 ChatGPT를 Siri와 Alexa와 같은 기존 음성 비서의 강력한 경쟁자로 만듭니다.
출시 후, 사용자들은 Sky 음성이 "Her"의 AI 캐릭터인 ‘사만다’와 유사하다는 점을 신속하게 인지하기 시작했고, OpenAI가 요한슨의 목소리 특성을 복제하기 위해 AI를 사용했을 가능성에 대한 추측이 일었습니다. 이에 대해 OpenAI는 Sky 음성을 일시 중지하며, 그것이 요한슨의 모방이 아니라 광범위한 다섯 달간의 채용 과정을 거쳐 선택된 전문 여배우의 목소리라는 점을 분명히 했습니다. OpenAI는 블로그 게시물에서 "AI 음성은 의도적으로 유명인의 독특한 목소리를 모방해서는 안 된다"고 강조하며, 400명의 지원자 중에서 다양성, 영속성, 따뜻함을 반영하는 기준에 따라 음성을 선택했다고 밝혔습니다.
Sky 음성이 일시 중지되는 상황에서도 나머지 네 가지 음성 옵션은 여전히 사용할 수 있습니다. GPT-4o의 새로운 음성 모드가 출시됨에 따라 사용자는 AI와 상호 작용하며 이러한 대체 음성을 탐색할 수 있습니다.
Sky 음성의 향후 계획에 대해서는 OpenAI가 요한슨 캐릭터와의 유사성 문제를 해결하기 위해 어떤 조정을 진행할지 아직 불투명합니다. 회사는 관련 음성 배우들과의 협력을 지속적으로 추진하며, 다양한 사용자 선호와 관심에 맞춘 추가 음성 옵션을 확장할 계획입니다.