국내 AI 모델 키미가 200만 단어의 맥락 입력 길이를 손실 없이 달성하며 중대한 기술 혁신을 이루었습니다. 이로 인해 긴 텍스트 처리 능력이 크게 향상되고, 국내 AI 애플리케이션 시장에서 선호되는 선택지가 되었습니다.
AI 언어 모델 GPT-4는 인간의 사고를 변화시키는 설득력을 지니며, 의견 영향력이 급증하고 있다. 감정 반응 기술로 더욱 정교해진 AI는 사회적 안정성과 개인 권리를 위협할 수 있어 신중한 접근과 규제가 필요하다.
MuseV의 가상 캐릭터 비디오 솔루션이 출시되어, 텍스트 및 기존 콘텐츠를 활용해 다양한 비디오 제작을 지원합니다. 캐릭터 일관성을 유지하며 사용자 경험을 개선하고, 실시간 립싱크 기능도 계획 중입니다. 업계에서 큰 주목을 받고 있습니다.
마이크로소프트는 AI 기반의 Xbox 챗봇을 개발 중이며, 이는 음성 및 텍스트로 플레이어 지원 문제를 해결합니다. "Xbox Support Virtual Agent"는 다양한 서비스를 제공하며, AI 응용 프로그램을 통한 게임 개발 혁신도 탐색하고 있습니다.
OpenAI의 ChatGPT에 이미지 생성 기능이 강화되어 사용자는 생성된 이미지를 클릭해 편집할 수 있는 브러시 툴을 활성화할 수 있게 되었습니다. DALL-E 3 모델이 지원하며, 스타일 영감 기능도 추가되었습니다. 그러나 저작권 문제에 대한 우려가 지속되고 있습니다.
레셈블 AI는 신속 음성 클로닝 기능을 출시하여 사용자가 1분 이내에 짧은 오디오 샘플로 음성을 복제할 수 있도록 했다. 이 혁신은 콘텐츠 제작 및 사용자 맞춤형 경험을 개선하며, 다양한 산업에서 활용될 것으로 기대된다.
OpenAI의 비디오 생성 모델 Sora가 고화질 비디오 제작에서 큰 성과를 내며 업계를 선도하고 있습니다. Sora는 다른 초기 모델들의 한계를 극복하고 있으며, 비디오 생성 기술의 상업적 가능성과 오용 우려가 남아 있지만, 미래는 밝습니다.
AI는 사이버 보안에 대한 기회와 도전을 제공하며, 보안 전문가의 67%가 AI를 실험해봤고, 55%가 도입 예정입니다. 그러나 C-suite와 직원 간 이해 차이가 크고, 공격자에게도 이점을 줄 수 있어 신중한 접근이 필요합니다.
Stability AI는 Stable Audio 2.0을 출시하여 텍스트 프롬프트 기반의 최대 3분 길이 고품질 오디오 생성 기능을 도입했습니다. 새 모델은 오디오 샘플 업로드와 저작권 준수를 보장하며, API 접근이 곧 제공될 예정입니다.
AWS는 생성 AI 개발을 위한 관리형 서비스 아마존 베드록에 Mistral Large 모델을 추가하여 개발자들이 향상된 AI 애플리케이션을 구축할 수 있게 했다. 이 모델은 다국어 작업에서 우수한 성능을 발휘하며, 모든 Mistral 모델은 주요 지역에서 사용 가능하다.
Cloudflare는 Hugging Face AI 애플리케이션 통합을 강화하며, 서버리스 GPU 기반 추론 솔루션인 Workers AI를 제공한다. 개발자는 클릭 한 번으로 14개의 모델을 배포해 실시간 전달을 보장하고, 글로벌 GPU를 활용할 수 있다.
쿤룬완웨이 그룹은 AI 음악 생성 모델 "SkyMusic"의 무료 테스트를 발표했습니다. 이 모델은 고품질 음악 생성, 감정 조정, 다양한 장르 지원 등 다섯 가지 기능을 갖추고 있으며, 4월 17일 공식 출시 예정입니다. 전문가들은 혁신적 변화를 기대하고 있습니다.
Intel의 Gaudi 2는 Nvidia의 AI 가속기와 강력하게 경쟁하며, LLM 추론에서 동일한 지연 시간을 유지하고 더 높은 메모리 대역폭 활용도를 기록합니다. Gaudi 2는 훈련 성능에서 H100에 이어 두 번째로 빠르며, Intel은 2024년 Gaudi 3를 출시할 계획입니다.
OpenAI는 65억 달러 자금 조달을 통해 최대 1,500억 달러의 평가액을 목표로 하며, 50억 달러 회전 대출도 탐색 중입니다. Thrive Capital과 Microsoft 등이 참여해 AI 기술의 발전을 이끌며, OpenAI는 시장 기회를 확장하고 있습니다.