마이크로소프트는 AI 서비스 계약을 업데이트하며 사용자에게 신중한 접근을 권장하고, AI 도구가 전문 조언을 대체하지 않도록 설계되었다고 강조했다. 특히 건강 챗봇의 위험을 언급하며 과도한 의존에 대해 경고했다. 새로운 조건은 다음 달 시행된다.
대규모 언어 모델 평가의 인간 주석 의존도를 줄이기 위해 메타 FAIR의 연구자들은 자기 학습 평가자를 개발했습니다. 이 방법은 비용과 시간을 절감하며, 모델의 정확성을 향상시킵니다. 그러나 초기 모델 선택과 수동 테스트의 중요성을 간과해서는 안 됩니다.
세일즈포스가 xGen-MM(또는 BLIP-3)이라는 오픈소스 멀티모달 AI 모델을 출시했다. 40억 개 매개변수를 가진 이 모델은 다양한 벤치마크에서 성능이 뛰어나며, 여러 이미지와 텍스트를 처리하는 혁신적인 기능을 갖추고 있다. 안정성 및 윤리적 고려를 포함한 다양한 변형이 제공된다.
AI의 미래는 변환기 아키텍처를 넘어 개인화된 에이전트와 다양한 새로운 모델로 진화하고 있으며, 기업은 기술적 도전과 보안 문제에 직면하고 있습니다. 최신 연구와 혁신이 효율적이고 비용 효과적인 AI 솔루션을 제공할 전망입니다.
Llama 3.1과 GPT-4o의 비교를 통해 소형 언어 모델의 경쟁력을 강조한다. Llama 3.1은 기발한 검색 전략으로 성능을 향상시키고, 비용 효율성 및 확장성에서 장점을 보인다. GPT-4o는 여전히 우수하지만 Llama 3.1은 새로운 기회를 제시한다.
아마존의 AWS AI 팀은 RAGChecker라는 혁신적인 도구를 통해 AI 시스템의 정확성을 향상시키고, Retrieval-Augmented Generation(RAG) 시스템을 평가하는 포괄적인 프레임워크를 제공합니다. 이 도구는 검색 및 생성 단계의 약점을 진단하고, AI 콘텐츠의 신뢰성을 높이며, 다양한 산업에서 AI의 발전에 기여할 것으로 기대됩니다.
8월 16일 상하이에서 열린 GOTC2024에서 화웨이의 장춘후이는 ModelEngine의 실용적 응용을 공유하며, AI 훈련 및 추론을 위한 종합 도구 체인으로서의 기능을 설명했다. 이 플랫폼은 데이터 처리 시간을 단축하고 AI 애플리케이션 개발을 지원한다.
AI 이미지 생성 분야에서 Midjourney는 새로운 웹 편집기를 도입, 인페인팅 및 아웃페인팅 기능을 통합하여 사용자 편의성을 높였다. Discord와의 통합 커뮤니케이션 향상과 함께, 최근 아티스트의 저작권 침해 주장으로 어려움을 겪고 있으나, 업데이트에 대한 긍정적인 피드백이 이어지고 있다.
xAI가 8월 14일 차세대 AI 챗봇 그록-2를 출시했다. 두 가지 버전(주 모델, 경량형)으로 구성된 그록-2는 뛰어난 이해 능력을 자랑하며, 성능은 GPT-4 수준으로 평가된다. 향후 그록-3 개발 계획도 발표되었다.
Lambda는 Nous Research와 협력하여 Llama 3.1 기반의 Hermes 3를 출시했습니다. 4050억 매개변수를 자랑하는 이 모델은 뛰어난 반응 능력과 창의적 작업에 적합하며, AI의 진화를 보여주는 혁신적인 기능들을 제공합니다.
일론 머스크의 AI 스타트업 xAI가 Grok-2 챗봇을 출시하며, 성능이 OpenAI, 구글 제품과 경쟁 가능하다고 주장했습니다. Grok-2는 AI 평가에서 상위 모델로 평가받고 있으며, 사용자 지침 준수 및 정확한 정보 제공에 중점을 두고 개선되었습니다.
PwC 조사에 따르면 미국 경영자의 73%가 생성적 AI를 도입 중이나, AI 위험 평가를 시작한 기업은 58%에 불과하다. 책임 있는 AI 전략은 가치, 안전, 신뢰를 중시하며 AI 관리 복잡성이 완전 구현을 저해할 수 있다.