구글이 엔터프라이즈 앱 개발을 위한 최첨단 생성 AI 모델인 제미니(Gemini)를 공식 출시했습니다. 지난주 공개된 제미니는 울트라(Ultra), 프로(Pro), 나노(Nano) 3가지 버전으로 제공됩니다. 오늘 발표된 내용에 따르면, 프로 버전은 API를 통해 무료로 사용할 수 있으며, 특정 사용 한도가 적용됩니다. 자세한 내용은 최근 블로그 게시물에서 확인할 수 있습니다.
제미니 프로를 위한 개발자 주요 기능
개발자들은 구글 AI 스튜디오 API를 통해 제미니 프로의 첫 번째 버전에 접근할 수 있으며, 이는 웹 기반 플랫폼으로 프롬프트를 생성하고 앱 개발을 위한 API 키를 얻을 수 있습니다. 이 버전은 텍스트 생성에 32K 컨텍스트 윈도우를 제공하며, 앞으로 이 기능을 확장할 계획입니다.
구글은 텍스트와 이미지 입력을 모두 받아 텍스트 출력을 제공하는 전용 제미니 프로 비전(multimodal endpoint)도 도입했습니다. CEO 순다르 피차이는 X에서 제미니 API의 포괄적인 기능을 강조하며, 함수 호출, 임베딩, 의미 검색, 맞춤형 지식 기반, 채팅 기능 등을 소개했습니다. 이 API는 180개국 이상에서 38개 언어를 지원합니다.
제미니 프로는 구글 클라우드의 엔드 투 엔드 AI 플랫폼인 버텍스 AI에 통합되어, 도구, 완전 관리형 인프라, 내장된 개인 정보 보호 및 안전 기능을 제공합니다. 이러한 통합은 개발자가 필요에 따라 관리 환경으로 전환할 수 있도록 지원합니다. 구글은 개발자들의 피드백을 수집하여 제미니 프로를 개선하고, 내년에는 더 복잡한 제미니 울트라를 출시할 계획입니다.
제한된 무료 접근
현재 구글은 제미니 프로와 제미니 프로 비전을 무료로 제공하며, 분당 60 요청의 속도 제한이 적용됩니다. 이는 버텍스 AI에서 모델을 사용하는 개발자에게도 적용되며, 이 무료 접근은 내년 일반 출시까지 가능합니다. 특히 구글의 무료 한도는 경쟁사의 20배에 달해 대부분의 개발 프로젝트에 적합합니다.
서비스가 완전 가동되면 사용량에 따라 가격이 책정되며, 1,000자 또는 이미지당 요금이 부과됩니다. 제미니 프로의 입력 가격은 1K 문자당 $0.00025, 이미지당 $0.0025로 설정되어 있으며, 출력은 1K 문자당 $0.0005입니다. 일부 X 사용자들은 구글의 문자 기반 요금 모델이 전체 단어를 포함할 수 있는 숫자 표현인 토큰 단위로 요금을 부과하는 경쟁사 OpenAI보다 상당히 비쌀 수 있다고 지적했습니다.
버텍스 AI의 개선
제미니 프로 출시와 함께 구글은 최근 텍스트-이미지 확산 기술인 이미전 2(Imagen 2)를 적용하여 버텍스 AI를 업데이트했습니다. 이 업그레이드는 다양한 창의적이고 현실적인 로고, 엠블렘, 레터마크를 생성하며 다국어 텍스트 렌더링 결과도 향상시킵니다. 또한 구글은 헬스케어 부문에 맞춤화된 기초 모델군인 MedLM을 버텍스 AI를 통해 미국 기반 조직에 제공한다고 발표했습니다. 이 신규 제공은 이전 Med-PaLM 2 기초 모델을 기반으로 하며, 곧 제미니 기반의 업그레이드가 예상됩니다.