애플 연구원들, 증가하는 기업 투자 속에서 다중 모달 AI 분야의 혁신을 이끌다

Home AI 뉴스 애플 연구원들, 증가하는 기업 투자 속에서 다중 모달 AI 분야의 혁신을 이끌다

Apple 연구원들이 텍스트와 이미지를 통합한 대형 언어 모델(LLM) 훈련을 위한 혁신적인 방법을 공개했습니다. 이는 인공지능(AI) 분야의 중요한 발전을 의미하며, 향후 Apple 제품을 더욱 향상시킬 것입니다. 이 연구는 "MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training"이라는 제목의 논문으로 arxiv.org에 최근 게시되었습니다. 연구에서는 다양한 훈련 데이터 유형과 모델 아키텍처를 전략적으로 결합하여 다양한 AI 벤치마크에서 최신 성능을 달성할 수 있음을 보여줍니다.

연구자들은 “이미지 캡션, 교차 이미지-텍스트, 텍스트 전용 데이터의 신중한 혼합을 사용한 대규모 멀티모달 프리트레이닝이 여러 벤치마크에서 최첨단 few-shot 성과를 달성하는 데 필수적임을 입증합니다.”라고 설명합니다. 비주얼과 언어 정보가 포함된 다양한 데이터셋으로 모델을 훈련하여 MM1 모델이 이미지 캡션 생성, 시각적 질문 응답, 자연어 추론과 같은 작업에서 뛰어난 성과를 거둘 수 있게 되었습니다.

주요 발견 사항: 시각적 요소

이미지 인코더와 입력 해상도의 선택이 모델 성능에 중요한 영향을 미칩니다. 연구는 “이미지 인코더, 해상도 및 이미지 토큰 수는 상당한 영향을 미치며, 비전-언어 연결 디자인은 비교적 중요하지 않다.”고 밝혔습니다. 이는 이러한 멀티모달 모델에서 시각적 요소의 지속적인 확장과 조정이 더 많은 잠재력을 여는 데 필수적임을 강조합니다.

특히, 300억 개 매개변수를 가진 가장 큰 MM1 모델은 강력한 맥락 학습 능력을 보여주며, 몇 가지 단계적 추론을 통해 여러 입력 이미지를 활용할 수 있습니다. 이는 대형 멀티모달 모델이 언어 이해와 생성이 필요한 복잡하고 개방적인 문제를 효과적으로 해결할 수 있음을 나타냅니다.

Apple의 AI 투자 전략

Apple은 Google, Microsoft, Amazon과 같은 경쟁사들과의 보조를 맞추기 위해 AI 투자를 대폭 늘리고 있습니다. 보고에 따르면, Apple은 AI 개발에 연간 10억 달러를 지출할 예정입니다. 내부 소식에 따르면 Apple은 "Ajax"라는 대형 언어 모델 프레임워크와 "Apple GPT"라는 챗봇을 개발 중이며, 이는 Siri, Messages, Apple Music과 같은 제품을 향상시키고 개인화된 재생 목록 자동 생성 및 코드 작성을 도와주는 기능을 추가할 가능성이 있습니다.

Apple CEO 팀 쿡은 AI의 중요성을 강조하며, "우리는 AI와 머신 러닝을 기본 기술로 보고 있으며, 우리가 출시하는 거의 모든 제품에 통합되고 있습니다. 구체적인 세부 사항을 공유할 수는 없지만, 이 분야에 상당한 투자를 하고 있다는 점은 확실합니다. 그 결과로 제품 개선을 보게 될 것입니다."라고 말했습니다.

경쟁하는 AI 환경

Apple의 전략은 역사적으로 기술 트렌드에 대해 빠른 추종자 접근 방식을 선호했습니다. 그러나 AI가 디지털 환경을 혁신할 것으로 예상됨에 따라, Apple은 경쟁력을 유지하는 것이 중요합니다. MM1 연구는 Apple의 첨단 발전 능력을 보여주지만, 회사가 변화하는 AI 환경에서 성공할 만큼 신속하게 행동할 수 있을지는 두고 봐야 할 일입니다.

모든 눈은 6월에 열리는 Apple의 세계 개발자 회의(WWDC)에 집중되고 있으며, 새로운 AI 기반 기능과 개발 도구가 기대됩니다. 한편, Keyframer 애니메이션 도구와 같은 작은 AI 발전들은 Apple의 연구 노력이 꾸준히 진행되고 있음을 반영합니다.

팀 쿡이 언급했듯이, "올해 말 AI 분야에서 우리의 진행 중인 작업에 대한 세부 정보를 공유할 수 있게 되어 기쁩니다." 이 작업은 멀티모달 인텔리전스에서 뛰어난 성과를 내기 위한 상당한 노력을 포함하는 것으로 보이며, 곧 Apple이 고도화된 인간 비슷한 AI의 새로운 시대에서 중요한 역할을 하게 될 것입니다.

벡터 데이터베이스: 반짝이는 물체 증후군을 극복하고 신비로운 유니콘을 찾기 위한 여정

Deci, 혁신적인 AI 개발 플랫폼과 콤팩트한 Deci Nano 모델을 공개하다

Most people like

Junia AI

1.2M

오늘날의 디지털 환경에서 심층적인 SEO 콘텐츠를 제작하는 것은 온라인에서 두각을 나타내는 데 필수적입니다. AI 작가는 콘텐츠 제작 접근 방식을 혁신하고 있으며, 독자들을 사로잡고 검색 엔진 순위를 높이는 고품질 기사를 보다 쉽게 생성할 수 있게 해줍니다. 인공지능의 능력을 활용하면 주목을 끌고 가시성을 높이며 웹사이트로 트래픽을 유도하는 최적화된 콘텐츠를 생성할 수 있습니다. AI 작가가 귀하의 콘텐츠 전략을 어떻게 향상시킬 수 있는지, 그리고 SEO 목표를 달성하는 데 어떻게 도움이 되는지 알아보세요.

AI 콘텐츠 생성 AI SEO Assistant

Romantic AI

281.4K

AI로 구동되는 여자친구와 함께하는 가상 동반자의 세계를 발견하세요. 흥미로운 대화와 의미 있는 연결이 기다리고 있습니다. 기술이 관계를 어떻게 향상시키는지 알아보고, 개인화된 상호작용으로 당신의 경험을 풍부하게 만들어 보세요.

가상 동반자 AI Girlfriend

SubtitleBee

57.7K

비디오에 캡션과 자막을 신속하고 간편하게 추가하세요. 접근성과 참여를 높이기에 완벽한 우리 도구를 사용하면 더 넓은 청중에게 도달하기가 쉬워집니다.

비디오 자막 Captions or Subtitle

AI Language Learning - SpeakPal

83.2K

AI 기반 언어 학습 플랫폼을 소개합니다. 이 혁신적인 도구는 실시간 대화, 개인 맞춤 피드백, 재미있는 활동을 제공하여 언어 습득 과정을 향상시킵니다. 역동적인 환경에서 speaking, listening, writing 연습을 통해 편리하게 학습하며, 여러분의 특별한 목표에 맞춘 학습 경험을 제공합니다. 우리의 인터랙티브 채팅 기능으로 언어 학습의 세계를 열고, effortless하게 스킬을 향상하세요.

AI 언어 학습 플랫폼 AI Chatbot

Find AI tools in YBX