메타, 오디오, 텍스트 및 워터마크 혁신을 위한 새로운 AI 모델 공개

Home AI 뉴스 메타, 오디오, 텍스트 및 워터마크 혁신을 위한 새로운 AI 모델 공개

메타의 기본 AI 연구팀(FAIR)은 연구자들을 위한 새로운 AI 모델과 도구들을 공개했습니다. 이들 모델은 오디오 생성, 텍스트-비전 기능, 워터마킹 기술에 중점을 두고 있습니다. 메타는 보도 자료에서 “우리의 초기 연구를 공개함으로써 혁신을 촉진하고 책임감 있게 AI를 발전시키길 희망합니다”라고 밝혔습니다.

오디오 생성 모델: JASCO 및 워터마킹 도구

메타는 JASCO(시간 제어 텍스트-음악 생성을 위한 공동 오디오 및 기호 조정)를 소개합니다. 이 모델은 사용자가 코드나 비트와 같은 요소를 입력하여 최종 출력물을 정교하게 개선할 수 있도록 합니다. FAIR의 연구에 따르면 JASCO는 사용자가 텍스트 명령을 통해 생성된 오디오의 특성—코드, 드럼, 멜로디 등을 조작할 수 있게 하여 원하는 소리를 만들어낼 수 있습니다.

FAIR는 JASCO 추론 코드를 MIT 라이선스 하에 AudioCraft AI 오디오 모델 라이브러리의 일부로 배포할 예정이며, 사전 훈련된 모델은 비상업적 크리에이티브 커먼즈 라이선스 하에 제공됩니다. 또한 메타는 AI 생성 음성을 워터마킹하는 혁신적인 도구인 AudioSeal을 출시하여 이러한 콘텐츠를 보다 효과적으로 식별할 수 있도록 합니다.

메타는 “AudioSeal은 AI 생성 음성을 지역적으로 감지하기 위해 특별히 설계된 첫 번째 오디오 워터마킹 기술로, 긴 오디오 파일 내에서 AI가 생성한 구간을 식별하는 데 도움을 줍니다”라고 전했습니다. 이 도구는 전통적인 방법에 비해 485배 빠른 탐지 속도를 제공하여 효율성을 높입니다. 다른 모델과 달리 AudioSeal은 상업적 라이선스 하에 배포됩니다.

카멜레온 모델 출시

FAIR는 연구 전용 라이선스 하에 멀티모달 텍스트 모델 카멜레온의 두 가지 버전인 카멜레온 7B와 34B를 출시할 계획입니다. 이 모델들은 이미지 캡셔닝과 같은 시각적 및 텍스트 이해가 필요한 작업을 위해 설계되었습니다. 그러나 메타는 카멜레온 이미지 생성 모델을 현재 제공하지 않으며, 텍스트 관련 기능에 제한된 접근만 가능하다고 발표했습니다.

또한 연구자들은 여러 미래 단어를 동시에 훈련시키는 다중 토큰 예측 방법을 이용할 수 있게 되며, 이는 비상업적 연구 전용 라이선스 하에서만 접근 가능합니다.

맥시멈을 만나보세요: AI 품질 문제 해결을 위한 종합 평가 플랫폼

Decagon, 스텔스 모드에서 벗어나 ‘인간과 유사한’ AI 에이전트를 공개하여 기업 고객 지원을 혁신하다

Most people like

Beatoven.ai

514.6K

Beatoven.ai를 만나보세요. 콘텐츠 제작자를 위해 특별히 설계된 혁신적인 AI 음악 생성기입니다. Beatoven.ai를 통해 손쉽게 독특한 분위기 기반 음악을 만들어 프로젝트를 발전시키고, 스토리텔링을 강화하며, 청중의 마음을 사로잡을 수 있습니다.

저작권 프리 음악 AI Music Generator

Moning

122.9K

손쉽게 투자 현황을 찾아보고 모니터링하세요.

투자 Investing Assistant

Easy With AI

1.6M

인터넷에서 최고의 AI 도구 모음을 만나보세요 온라인에서 사용할 수 있는 가장 방대한 AI 도구 모음을 탐색하세요. 개발자, 마케터, 연구자 누구나 사용할 수 있도록 엄선한 혁신적인 솔루션이 여러분의 필요에 맞춰 제공됩니다. 성장하는 커뮤니티에 참여하고 오늘날 최첨단 인공지능 기술로 여러분의 프로젝트를 향상시키세요!

인공지능 AI Tools Directory

Decktopus AI

300.9K

Decktopus를 사용하여 손쉽게 프레젠테이션 수준을 높이세요. AI 기반 프레젠테이션 제작기로, 짧은 시간 내에 놀라운 슬라이드를 만들 수 있습니다.

프레젠테이션 제작기 AI Content Generator

Find AI tools in YBX