Assembly AI의 유니버설-1 모델, Whisper보다 30% 적은 환각 현상 자랑

Home AI 뉴스 Assembly AI의 유니버설-1 모델, Whisper보다 30% 적은 환각 현상 자랑

AI-as-a-service 제공업체 Assembly AI가 최신 음성 인식 모델 Universal-1을 출시했습니다. 1,250만 시간 이상의 다국어 오디오 데이터를 기반으로 훈련된 Universal-1은 영어, 스페인어, 프랑스어, 독일어에서 인상적인 음성-텍스트 정확도를 달성합니다. 회사에 따르면 Universal-1은 OpenAI의 Whisper Large-v3 모델에 비해 음성 데이터에서 환각을 30%, 주변 소음에서는 90% 줄여줍니다.

Assembly AI는 최근 블로그 게시물에서 Universal-1을 여러 언어에서 정확하고 신뢰할 수 있으며 견고한 음성-텍스트 기능을 제공하기 위한 중요한 단계로 설명했습니다. 이 모델은 코드 스위칭 기능이 탁월하여 단일 오디오 파일 내에서 여러 언어를 동시에 전사할 수 있습니다.

Universal-1은 오디오 및 비디오 편집, 대화 분석에 중요한 개선된 타임스탬프 추정에서 두각을 나타냅니다. 이전 모델 Conformer-2보다 13% 더 향상된 성능을 보이며, 더 나은 화자 분리를 제공하고 최소-순열 단어 오류율(cpWER)을 14%로 개선했습니다. 또한 화자 수 추정 정확도가 71%로 증가했습니다.

이 모델은 최적화된 병렬 추론 기능을 갖추고 있어 긴 오디오 파일의 처리 시간을 크게 단축합니다. Universal-1은 Nvidia Tesla T4 기기에서 1시간 분량의 오디오를 단 21초 만에 전사하며, Whisper Large-v3보다 5배 빠른 속도를 자랑합니다. Whisper Large-v3는 같은 작업을 수행하는 데 107초가 소요됩니다.

향상된 음성-텍스트 AI 모델은 더 정확하고 신뢰할 수 있는 노트를 생성하고, 작업 항목을 식별하며, 고유 명사, 화자 식별, 타이밍과 같은 메타데이터를 정리하는 등 많은 이점을 제공합니다. 이러한 개선은 AI 기반 비디오 편집에서 정밀한 임상 노트 입력 및 청구 제출이 필요한 원격 의료 플랫폼에 이르기까지 다양한 응용 프로그램에 도움이 될 것입니다.

Universal-1 모델은 Assembly AI의 API를 통해 지금 이용할 수 있습니다.

퍼플렉시티의 성장 도전이 SEO 우려를 초래하고 구글의 우위를 드러내다

메타의 이미지 생성기가 복합 인종 커플과 우정을 표현하는 데 어려움을 겪고 있습니다.

Most people like

Cognify Insights

6.4K

심층 분석을 위해 특별히 설계된 강력한 브라우저 확장 프로그램으로 연구의 잠재력을 최대한 활용하세요. 학생, 전문가 또는 호기심 많은 학습자라면 이 도구가 귀하의 탐색 경험을 향상시키고 귀중한 통찰력과 자원을 원활하게 통합합니다. 이 확장 프로그램이 어떻게 귀하의 연구 과정을 향상시켜 중요한 정보를 쉽게 수집, 조직 및 분석할 수 있는지 확인해 보세요. 오늘날 연구 수행 방식을 혁신하는 수많은 다른 사람들과 함께하세요!

연구 보조원 Research Tool

Humanlinker

23.8K

휴먼링커는 첨단 AI 기술을 활용하여 기업이 최적의 가이던스를 제공하며 대규모로 하이퍼 개인화된 판매 경험을 제공할 수 있도록 지원합니다.

인공지능 Other

v0.dev

AI 기반 생성 UI 시스템을 소개합니다. 사용자 경험을 혁신하도록 설계된 이 혁신적인 기술은 인공지능의 힘을 활용하여 개인의 요구와 선호에 맞게 동적이고 반응적인 사용자 인터페이스를 생성합니다. 우리의 생성 접근 방식이 디자인 효율성을 향상시키고 상호작용 품질을 높이는 방법을 알아보세요.

생성적 사용자 인터페이스 AI Code Generator

IndieFeel.com

9.3K

노래는 종종 깊은 메시지와 감정을 담고 있어, 청취자에게 그 깊은 의미를 탐구하도록 초대합니다. 노래의 의미를 해석하는 것은 음악에 대한 우리의 감상을 높일 뿐 아니라, 아티스트의 의도와 그들이 전달하는 감정에 연결될 수 있게 해줍니다. 이 가이드에서는 노래 가사를 해석하고 그 안에 펼쳐진 이야기들을 이해하기 위한 다양한 기법을 살펴보겠습니다. 평범한 청취자이든 음악 애호가이든, 노래의 의미를 해석하는 법을 배우는 것은 듣는 경험을 풍부하게 하고 음악 예술에 대한 더 큰 연결감을 키울 수 있습니다.

노래 Other

Find AI tools in YBX