인공지능 비디오 생성 기술에서 구글의 Veo가 OpenAI의 Sora와 경쟁할 만한 모델로 등장했습니다. Veo는 자연어 이해력이 뛰어나고 1080p 비디오를 생성하며 다양한 스타일을 지원합니다. 구글은 추가 기능 탐색 중이며, Veo는 고품질 비디오 경험을 약속합니다.
구글 I/O 2024에서 구글은 안드로이드 15에 Gemini AI 챗봇을 통합하여 사용자 경험을 혁신한다고 발표했습니다. Gemini는 애플리케이션 환경을 이해하고, 쿼리 수행, PDF 처리 등 새로운 기능을 제공해 사용자 상호작용을 향상시킬 예정입니다.
GPT-4o는 OpenAI의 최신 언어 모델로, 사용자가 생산성을 높일 수 있도록 다양한 기능을 제공합니다. 본 기사에서는 효율적인 입력 방법, 무료 기능 활용, 피드백 제공을 통해 GPT-4o를 최대한 활용하는 팁을 제시합니다.
앤트로픽이 유럽에 AI 어시스턴트 클로드를 출시했습니다. 금융 및 숙박 산업 등 다양한 분야에서 활용 가능성이 크며, 클로드 프로와 팀 구독 서비스도 선보였습니다. CEO는 데이터 안전성을 강조하며, 다국어 지원 챗봇을 제공하여 효율성을 높입니다.
전통적인 데이터베이스는 AI 시대의 복잡한 데이터 처리에 어려움을 겪고 있으며, 이를 해결하기 위해 LanceDB가 등장했다. 800만 달러 시드 라운드를 완료한 이 회사는 다중 모드 데이터 처리에 최적화된 오픈 소스 데이터베이스를 개발하고 있으며, 이미 다수의 저명한 조직이 활용하고 있다.
구글이 I/O 컨퍼런스에서 제미니 API 개발자 콘테스트를 발표하며 최대 30만 달러의 상금을 제공한다고 밝혔습니다. 대상 상금은 맞춤형 전기 딜로리언이며, 대회는 2024년 5월 14일부터 8월 12일까지 진행됩니다. 참가자는 앱을 개발하고 데모 영상을 제출해야 합니다.
일리아 수츠케버가 오픈AI를 공식적으로 떠났으며, 그의 퇴사는 샘 올트먼 CEO의 블로그를 통해 확인됐다. 야쿱 파호츠키가 신임 수석 과학자로 임명되었고, 수츠케버는 새로운 프로젝트를 시작할 예정이다. 그의 퇴사는 AI 모델 GPT-4o 발표 다음 날 이루어졌다.
OpenAI는 새로운 AI 모델 GPT-4o를 출시하며 혁신을 선도하고 있습니다. 이 모델은 텍스트, 오디오, 이미지 조합을 동시에 처리하고 감정 인식 기술을 통해 보다 인간적인 소통을 지원합니다. 무료 사용자에겐 GPT-4 수준의 지능을 제공합니다.
구글은 I/O 개발자 회의에서 프로젝트 아스트라를 발표하며 인공지능 기반 AI 에이전트의 초기 버전을 시연했습니다. 이 에이전트는 실시간으로 환경을 이해하고 사용자와 상호작용하는 목표를 갖고 있으며, Gemini 앱에 통합될 예정입니다.
칭화대 연구진은 대규모 언어 모델(LLM)의 추론 비용을 줄이기 위한 "주의 오프로딩" 기술을 제안했습니다. 이 기술은 비용 효율적인 GPU와 고성능 가속기를 최적화하여 LLM 추론을 개선하고, 새로운 시스템 '라미나'를 통해 처리량을 극대화합니다.
OpenAI는 ChatGPT 데스크톱 애플리케이션을 출시하며, 이는 AI 분야의 중요한 이정표로 평가됩니다. 초기에는 macOS Plus 사용자에게 제공되며, Windows 버전도 연내 출시 예정입니다. 새로운 GPT-4o 모델을 도입하여 사용자 경험을 향상시키고, 더 정확한 응답을 기대하고 있습니다.
구글이 DeepMind 개발의 새로운 생성 AI 비디오 모델 Veo를 발표했습니다. Veo는 1080p 고해상도 비디오 생성, 다양한 영화 스타일 지원, 비디오 편집 기능 등을 탑재하고 있으며, Creators와 교육자를 대상으로 합니다.