메타, 오디오, 텍스트 및 워터마크 혁신을 위한 새로운 AI 모델 공개

Home AI 뉴스 메타, 오디오, 텍스트 및 워터마크 혁신을 위한 새로운 AI 모델 공개

메타의 기본 AI 연구팀(FAIR)은 연구자들을 위한 새로운 AI 모델과 도구들을 공개했습니다. 이들 모델은 오디오 생성, 텍스트-비전 기능, 워터마킹 기술에 중점을 두고 있습니다. 메타는 보도 자료에서 “우리의 초기 연구를 공개함으로써 혁신을 촉진하고 책임감 있게 AI를 발전시키길 희망합니다”라고 밝혔습니다.

오디오 생성 모델: JASCO 및 워터마킹 도구

메타는 JASCO(시간 제어 텍스트-음악 생성을 위한 공동 오디오 및 기호 조정)를 소개합니다. 이 모델은 사용자가 코드나 비트와 같은 요소를 입력하여 최종 출력물을 정교하게 개선할 수 있도록 합니다. FAIR의 연구에 따르면 JASCO는 사용자가 텍스트 명령을 통해 생성된 오디오의 특성—코드, 드럼, 멜로디 등을 조작할 수 있게 하여 원하는 소리를 만들어낼 수 있습니다.

FAIR는 JASCO 추론 코드를 MIT 라이선스 하에 AudioCraft AI 오디오 모델 라이브러리의 일부로 배포할 예정이며, 사전 훈련된 모델은 비상업적 크리에이티브 커먼즈 라이선스 하에 제공됩니다. 또한 메타는 AI 생성 음성을 워터마킹하는 혁신적인 도구인 AudioSeal을 출시하여 이러한 콘텐츠를 보다 효과적으로 식별할 수 있도록 합니다.

메타는 “AudioSeal은 AI 생성 음성을 지역적으로 감지하기 위해 특별히 설계된 첫 번째 오디오 워터마킹 기술로, 긴 오디오 파일 내에서 AI가 생성한 구간을 식별하는 데 도움을 줍니다”라고 전했습니다. 이 도구는 전통적인 방법에 비해 485배 빠른 탐지 속도를 제공하여 효율성을 높입니다. 다른 모델과 달리 AudioSeal은 상업적 라이선스 하에 배포됩니다.

카멜레온 모델 출시

FAIR는 연구 전용 라이선스 하에 멀티모달 텍스트 모델 카멜레온의 두 가지 버전인 카멜레온 7B와 34B를 출시할 계획입니다. 이 모델들은 이미지 캡셔닝과 같은 시각적 및 텍스트 이해가 필요한 작업을 위해 설계되었습니다. 그러나 메타는 카멜레온 이미지 생성 모델을 현재 제공하지 않으며, 텍스트 관련 기능에 제한된 접근만 가능하다고 발표했습니다.

또한 연구자들은 여러 미래 단어를 동시에 훈련시키는 다중 토큰 예측 방법을 이용할 수 있게 되며, 이는 비상업적 연구 전용 라이선스 하에서만 접근 가능합니다.

맥시멈을 만나보세요: AI 품질 문제 해결을 위한 종합 평가 플랫폼

Decagon, 스텔스 모드에서 벗어나 ‘인간과 유사한’ AI 에이전트를 공개하여 기업 고객 지원을 혁신하다

Most people like

Solidroad

26.1K

판매 전화를 위해 특별히 설계된 AI 대화 시뮬레이터로 판매 전략을 강화하세요. 이 혁신적인 도구는 판매 전문가가 기술을 연습하고 다듬을 수 있도록 도와주며, 모든 상호작용이 매력적이고 설득력 있게 만들도록 합니다. 판매 접근 방식을 혁신하고 최첨단 AI 기술로 효과적인 커뮤니케이션의 영향을 경험해 보세요.

인공지능 Sales Assistant

Recall

404.5K

온라인 콘텐츠를 손쉽게 요약하고 저장하기 오늘날의 빠르게 변화하는 디지털 세계에서 온라인 콘텐츠 관리는 어려울 수 있습니다. 웹 콘텐츠를 효율적으로 요약하고 저장하는 방법을 통해 경험을 간소화해 보세요! 연구, 학습 또는 정보를 선별하는 과정에서 이 기술을 숙달하면 생산성을 높이고 작업 흐름을 원활하게 할 수 있습니다. 콘텐츠 관리를 쉽게 할 수 있는 최선의 방법을 살펴보겠습니다.

콘텐츠 요약 AI Knowledge Base

Notebook.ai

272.8K

세계 창작자와 작가를 위해 특별히 제작된 최신 스마트 노트북을 소개합니다. 이 노트북은 생생한 세계를 창조하고 발전시키는 데 도움을 줍니다.

세계 구축 AI Book Writing

VideoGen - AI Video Generator

1.4M

단 몇 초 만에 놀라운 AI 기반 비디오를 생성하세요.

비디오젠 AI Video Generator

Find AI tools in YBX