이번 주 인공지능(AI) 주요 뉴스
1. 딥마인드, 인간 교육 AI 시스템 공개
Google DeepMind가 인간 강사로부터 복잡한 작업을 직접 학습할 수 있는 혁신적인 AI 에이전트 시스템을 소개했습니다. Nature에 발표된 기초 논문에서는 '문화 전이'라는 방법을 소개하며, 이 방법을 통해 AI 모델이 미리 수집된 인간 데이터를 사용하지 않고도 기술을 배울 수 있도록 합니다. 이 새로운 접근 방식은 개체가 관찰을 통해 배우는 방식, 즉 비디오 튜토리얼을 따르는 것과 유사합니다. GoalCycle3D라는 시뮬레이션 환경에서 보여진 독창적인 소수 샷 모방 프로세스를 통해 AI 에이전트는 인간 시연자의 행동을 성공적으로 모방했고, 시연 종료 후에도 오랫동안 작업을 기억하는 결과를 보여주었습니다. 딥마인드는 이 기술이 인공지능 일반 지능의 개발에 문화적 진화를 통합하는 기반을 마련한다고 주장하며, 이 분야의 눈부신 발전을 이끌 것으로 기대하고 있습니다.
2. AI 인력 혁명 대비하기
Qantm AI의 창립자이자 CEO인 Seth Dobrin의 심도 있는 칼럼에서는 조직과 직원들이 AI 발전을 어떻게 능동적으로 활용할 수 있는지에 대해 논의합니다. 기술의 급속한 진화 속에서 오늘날의 인력은 AI 중심의 경제에 신속하게 재교육하고 적응하는 것이 중요합니다. Dobrin은 이러한 변화에 발맞추어 교육 시스템, 기업 교육 프로그램, 정부 정책이 함께 발전해야 할 필요성을 강조합니다. 생성적 AI의 영향은 모든 산업에 걸쳐 있으며, 수작업 노동과 화이트칼라 직종 모두에 영향을 미칩니다. 다양한 이해관계자 간의 협력이 필요하며, 이는 이 변혁의 시기에 대한 준비와 노동력의 혼란을 최소화하는 데 필수적입니다.
3. 구글, 제미니 출시: 강력한 새로운 언어 모델
구글이 다음 세대 대형 언어 모델인 제미니를 공식 출시했습니다. 제미니는 탁월한 능력을 지닌 모델로 주목받고 있습니다. 가벼운 혁신을 제공하는 세 가지 구성(울트라, 프로, 나노)을 갖춘 제미니는 모바일 장치부터 데이터 센터까지 다양한 기기에서 활용될 수 있습니다. 제미니 프로는 구글의 Bard 챗봇에 동력을 공급하여 그 reasoning 능력과 이해도를 향상시킵니다. 2024년 초에는 Bard Advanced가 추가 기능과 함께 출시될 예정입니다. 12월 13일부터 개발자와 기업 사용자는 Vertex AI와 Google AI Studio에서 Gemini API를 통해 Gemini Pro에 접근할 수 있습니다.
4. 메타의 오디오박스: 텍스트를 독특한 소리로 변환
메타는 텍스트를 소리로 변환하는 최신 AI 모델인 Audiobox를 출시했습니다. 이전 모델인 Voicebox와는 달리, Audiobox는 사용자가 자연어 프롬프트를 사용해 만들고자 하는 오디오를 설명할 수 있도록 합니다. 예를 들어, ‘파인애플 한 조각을 물어 먹는 비버’를 입력하면 해당 설명에 기반한 독특한 사운드스케이프가 생성됩니다. 또한, 모델은 텍스트 프롬프트와 음성 입력을 결합해 오디오를 합성할 수 있어, 사용자가 생성한 오디오의 스타일과 사운드 효과를 더 잘 제어할 수 있습니다. 이전 모델에서는 이런 기능이 제공되지 않았습니다. 메타의 연구 웹사이트에서 오디오 샘플을 경험해 보세요.
5. OpenAI, Rain AI로부터 전략적 칩 구매
OpenAI가 CEO Sam Altman이 공동 설립한 스타트업 Rain AI로부터 AI 칩을 5,100만 달러에 인수하는 중대한 계약을 체결했습니다. 이 협력은 인간 뇌의 정보 처리 방식을 모방하는 고급 신경형 처리 기술에 기반하고 있습니다. OpenAI와 Rain 간의 관계는 2019년으로 거슬러 올라가며, 혁신에서의 오랜 파트너십을 강조합니다. 최근 Altman과 관련된 내부 논란에도 불구하고, 이 거래는 OpenAI의 능력을 향상시킬 것으로 기대되며, Rain은 2024년 10월까지 첫 번째 하드웨어 배치를 제공합니다.