Nvidia는 NVLM 1.0 오픈소스 AI 모델을 발표하며 GPT-4와 경쟁할 만한 성능을 보입니다. NVLM-D-72B는 720억 개의 매개변수로 멀티모달 작업에서 탁월한 성과를 발휘하고, 오픈소스 접근으로 AI 연구의 혁신을 촉진합니다.
피카 랩스는 3천5백만 달러를 모금하며 피카 1.5를 출시했다.新 특수 효과 '피카펙트'를 통해 사용자들은 이미지의 형태를 극적으로 변화시킬 수 있다. 고급 모션 제어 기능과 5초 클립 생성이 가능하여, 창작자에게 새로운 가능성을 제공한다.
대형 언어 모델(LLMs)의 자기 수정 능력을 향상시키기 위해 딥마인드 연구진은 '강화 학습을 통한 자기 수정(SCoRe)' 방식을 제안하였다. SCoRe는 모델이 자기 생성 데이터를 통해 독립적으로 오류를 수정하도록 훈련하여, 이전 방법보다 성능을 크게 개선한다.
스탠포드 대학교의 Archon 프레임워크는 대형 언어 모델(LLMs)의 효율적 응답 생성을 위한 새로운 방법론으로, ITAS 알고리즘을 통해 성능을 향상시킵니다. 다양한 추론 기법을 활용하며, 70B 이상의 모델에서 특히 효과적입니다. 그러나 단일 턴 모델에 비해 성능이 낮고, 간단한 쿼리에는 덜 효과적입니다.
OpenAI는 2024 DevDay에서 AI 도구와 API의 개선에 초점을 맞추며, 개발자 지원과 커뮤니티 이야기를 강조했습니다. 주요 혁신으로 Prompt Caching, Vision Fine-Tuning, Realtime API, Model Distillation을 소개하며, 지속 가능한 AI 생태계 구축을 위해 전략적 전환을 추진하고 있습니다.
캘리포니아 주지사 개빈 뉴섬이 SB 1047 법안을 거부함으로써 AI 기업들은 사용자 보호 강화를 위한 기회를 얻게 되었다. 법안은 AI 안전 규제를 포함했으나, 전문가들은 이 결정이 혁신과 오픈 소스 개발을 보호할 것이라고 평가하고 있다. 반면, 비판자들은 공공 안전에 대한 우려를 제기하고 있다.
대규모 언어 모델(LLMs)에 도메인 및 고객 지식을 통합하는 검색 증강 생성(RAG) 방법은 기업에 중요하지만 한계가 있습니다. Microsoft 연구는 쿼리를 네 가지 수준으로 분류하여 데이터 증강 LLM 애플리케이션의 복잡성을 극복할 해법을 제시합니다.
캘리포니아 주지사 개빈 뉴섬은 "프론티어 AI 모델 안전 혁신법" (SB 1047)을 거부하며, 법안이 고위험 AI 시스템에 대한 요구 사항을 적절히 고려하지 못했다고 지적했다. 그는 혁신을 저해하지 않는 목표 지향적 정책 필요성을 강조했다.
Liquid AI는 MIT CSAIL 출신 연구자들이 설립한 스타트업으로, 변환기 아키텍처 대신 LFMs를 개발해 높은 성능과 메모리 효율성을 자랑합니다. 금융, 생명공학 등 다양한 분야에 최적화된 멀티모달 AI 모델의 출시를 예정하고 있습니다.
가브리엘 추아는 싱가포르 GovTech에서 데이터 과학자로 활동하며 Open NotebookLM을 출시, PDF를 개인 맞춤형 팟캐스트로 변환하는 오픈 소스 도구를 개발했습니다. 이는 AI 개발의 장벽을 낮추며, 사용자 친화적인 인터페이스를 제공하지만, 데이터 프라이버시와 보안 문제에 대한 우려도 존재합니다.
Google의 NotebookLM은 클라우드 기반 AI 작업 공간으로, 문서 업로드 및 질문 기능을 제공하며, AI 생성 팟캐스트의 '오디오 개요' 기능을 추가했습니다. 사용자 맞춤 설정이 가능해지고, 감정적 깊이로 반응하는 플랫폼입니다.
아티산이 AI 기반 가상 직원 아바를 통해 판매 혁신을 목표로 1,150만 달러의 시드 자금을 확보했다. 연 100만 달러의 수익을 올린 이 스타트업은 리드 생성과 이메일 작성을 자동화하며, AI의 활용 확장 계획도 세우고 있다.
샌프란시스코 AI 스타트업 Datasaur가 AI 프로젝트를 위한 텍스트 및 오디오 레이블링에 특화된 LLM Lab을 출시했습니다. 이 플랫폼은 커스터마이징된 언어 모델 개발을 지원하며, 클라우드와 온프레미스 배포 옵션을 제공합니다. LLM Lab은 다양한 모델과 통합 기능을 통해 데이터 프라이버시를 강화하고 자연어 처리의 경계를 넘어서는 솔루션을 목표로 합니다.