Lançamento da Pré-Visualização Pública do Google Gemini 1.5 Pro: Explorando Novos Recursos de Reconhecimento de Voz

No recente evento Google Next, a Google anunciou uma atualização significativa em seu modelo de IA, o Gemini 1.5 Pro, que agora possui capacidades de processamento de áudio sem precedentes. O Gemini 1.5 Pro pode interpretar e analisar diretamente arquivos de áudio enviados, extraindo informações valiosas de chamadas de ganhos ou de áudios de vídeos, sem a necessidade de transcrições escritas.

Um dos destaques dessa atualização é que o Gemini 1.5 Pro superou o Gemini Ultra, que era o modelo mais poderoso da série, em desempenho. A Google informou que este modelo consegue compreender comandos complexos sem precisar de ajustes finos, representando um grande avanço na tecnologia de IA.

É importante ressaltar que o acesso ao Gemini 1.5 Pro é limitado a usuários que utilizam o Vertex AI e o AI Studio. A maioria dos usuários interage com os modelos de linguagem do Gemini através do chatbot Gemini, enquanto o Gemini Ultra suporta os chatbots mais avançados. Embora o Gemini Ultra seja robusto, não alcança a velocidade do Gemini 1.5 Pro.

Além disso, a Google revelou atualizações para outro grande modelo de IA, o Imagen 2. Este sistema avançado de geração de texto para imagem aprimora as capacidades de imagem do Gemini, permitindo agora que os usuários adicionem ou removam elementos dentro das imagens. A Google também apresentou o SynthID, um recurso de marca d'água digital para todas as imagens criadas com o modelo Imagen, incorporando uma marca invisível que indica a fonte das imagens.

Adicionalmente, a Google apresentou um novo método que integra respostas de IA com o Google Search, permitindo fornecer respostas baseadas em informações em tempo real. Isso significa que modelos de linguagem grandes poderão oferecer dados atualizados, em vez de se basearem apenas em informações pré-existentes. Contudo, a Google decidiu restringir o Gemini de responder a perguntas relacionadas às eleições de 2024 nos EUA, refletindo um compromisso em lidar com informações sensíveis de maneira responsável.

Vale destacar que o Gemini enfrentou críticas por gerar imagens imprecisas de figuras históricas, lembrando-nos de que, apesar dos avanços na tecnologia de IA, a cautela continua sendo necessária ao lidar com dados históricos e da vida real.

Most people like

Find AI tools in YBX