O Google lançou oficialmente seu modelo de IA generativa mais avançado, o Gemini, voltado para necessidades de desenvolvimento de aplicativos empresariais. Revelado na semana passada, o Gemini está disponível em três versões: Ultra, Pro e Nano. O anúncio de hoje torna a versão Pro acessível através de uma API, permitindo que desenvolvedores a utilizem gratuitamente dentro de certos limites de uso, conforme detalhado em um recente post no blog.
Gemini Pro para Desenvolvedores: Principais Recursos
Os desenvolvedores podem acessar a primeira versão do Gemini Pro pela API do Google AI Studio, que oferece uma plataforma baseada na web para criar prompts e obter chaves de API para o desenvolvimento de aplicativos. Esta versão oferece uma janela de contexto de 32K para geração de texto, com planos de expandir esse recurso no futuro.
O Google também introduziu um endpoint multimodal dedicado, o Gemini Pro Vision, que aceita entradas de texto e imagem, fornecendo saídas em texto. Em uma postagem no X, o CEO Sundar Pichai destacou os recursos abrangentes da API do Gemini, incluindo chamadas de função, embeddings, recuperação semântica, personalização de conhecimento e capacidades de chat. A API suporta 38 idiomas em mais de 180 países.
O Gemini Pro também será integrado ao Vertex AI, a plataforma de IA de ponta a ponta do Google Cloud, que inclui ferramentas, infraestrutura gerenciada e recursos de privacidade e segurança integrados. Essa integração permite que os desenvolvedores transitem para um ambiente gerenciado conforme necessário.
A empresa pretende coletar feedback dos desenvolvedores para aprimorar o Gemini Pro enquanto se prepara para lançar o mais complexo Gemini Ultra no próximo ano.
Acesso Gratuito com Limitações
Atualmente, o Google oferece o Gemini Pro e o Gemini Pro Vision gratuitamente, com um limite de 60 solicitações por minuto. Isso se aplica também aos desenvolvedores que utilizam os modelos no Vertex AI, mas esse acesso gratuito estará disponível apenas até a liberação geral no próximo ano. Notavelmente, a cota gratuita do Google é 20 vezes maior que as ofertas dos concorrentes, tornando-a adequada para a maioria dos projetos de desenvolvimento.
Uma vez que o serviço esteja totalmente disponível, a cobrança será implementada com base no uso, cobrando por 1.000 caracteres ou imagens. Especificamente, o preço de entrada para o Gemini Pro é de $0.00025 por 1K de caracteres e $0.0025 por imagem, enquanto a saída permanece em $0.0005 por 1K de caracteres. Alguns usuários no X observaram que o modelo de preços do Google, que cobra por caractere, é significativamente mais alto que o dos concorrentes, como a OpenAI, que normalmente cobra por token—uma representação numérica que pode abranger palavras inteiras.
Melhorias no Vertex AI
Além do lançamento do Gemini Pro, o Google atualizou o Vertex AI com sua mais recente tecnologia de difusão de texto para imagem, Imagen 2. Essa atualização introduz recursos para gerar uma ampla variedade de logotipos, emblemas e marcas, enquanto melhora os resultados na renderização de texto em vários idiomas.
Adicionalmente, o Google anunciou a disponibilidade do MedLM, uma família de modelos fundamentais ajustados para o setor de saúde, para organizações baseadas nos EUA através do Vertex AI. Esta nova oferta baseia-se no modelo fundamental anterior Med-PaLM 2, com uma atualização baseada no Gemini esperada em breve.