이번 주 구글 I/O 개발자 회의에서 구글은 최신 인공지능 모델인 Gemini 1.5 Flash를 공개했습니다. 이 모델은 속도와 효율성에 최적화되어 있으며, 개발자들이 필요로 하는 경량의 비용 효율적이면서도 강력한 AI 도구를 제공합니다.
구글 딥마인드의 CEO인 데미스 하사비스는 Gemini 1.5 Flash가 요약, 채팅 기능, 이미지 및 비디오 캡션 작성, 긴 문서와 스프레드시트에서 데이터 추출 등 다양한 애플리케이션에서 뛰어난 성능을 보여준다고 강조했습니다. 새로운 모델은 Gemini 1.5 Pro에서 핵심 지식과 기술을 전이하는 '증류' 과정을 통해 더 compact한 디자인으로 설계되어, 경량 아키텍처와 강력한 기능 사이의 균형을 이룹니다.
작은 사이즈에도 불구하고, Gemini 1.5 Flash는 Pro 버전과 동일한 다중 모드 기능을 갖추고 있으며, 최대 100만 개의 토큰을 처리할 수 있는 긴 문맥 창을 특징으로 합니다. 이를 통해 개발자들은 최대 1,500 페이지의 문서나 30,000줄이 넘는 코드를 한 번의 실행으로 분석할 수 있어, 획기적인 편리함을 누릴 수 있습니다.
Gemini 1.5 Flash는 개발자들이 AI 제품과 서비스를 더 빠르고 경제적으로 구축할 수 있도록 설계되었습니다. 또한 구글은 Gemini 1.5 Pro의 기능을 향상시켜 코딩, 추론, 오디오-비주얼 분석에서도 개선된 성능을 제공합니다. 흥미롭게도, 구글은 올해 말까지 현재 모델의 문맥 창을 200만 개의 토큰으로 늘릴 계획이며, 이를 통해 2시간 분량의 비디오, 22시간의 오디오, 60,000줄 이상의 코드 또는 140만 단어 이상의 콘텐츠를 동시에 처리할 수 있도록 지원할 것입니다.
현재 Gemini 1.5 Flash와 Pro 버전 모두 구글 AI 스튜디오와 Vertex AI에서 미리보기로 제공되고 있습니다. 구글은 또한 새로운 오픈 모델인 Gemma 2의 버전을 발표했습니다. 이러한 업데이트는 주로 AI 애플리케이션 구축에 관심이 있는 개발자와 사용자들을 위한 것으로, 일반 소비자들이 직접적인 혜택을 받을 가능성은 낮습니다.
Gemini 1.5 Flash의 출시는 구글의 AI 분야에서의 혁신적인 역량을 재확인하며, 개발자들에게 미래 AI 제품과 서비스의 발전을 위한 강력하고 유연한 도구를 제공합니다.