Lancement de la Préversion Publique de Google Gemini 1.5 Pro : Découverte des Nouvelles Fonctionnalités de Reconnaissance Vocale

Lors de l'événement Google Next récent, Google a annoncé une mise à jour majeure de son modèle d'IA, Gemini 1.5 Pro, lui conférant des capacités de traitement audio sans précédent. Désormais, Gemini 1.5 Pro peut interpréter et analyser directement des fichiers audio téléchargés, extrayant des informations précieuses des appels de résultats ou des vidéos audio sans nécessiter de transcriptions écrites.

Un aspect clé de cette mise à jour est que Gemini 1.5 Pro surpasse désormais Gemini Ultra, anciennement le modèle le plus puissant de la série, en termes de performance. Google a indiqué que ce modèle peut comprendre des commandes complexes sans ajustement, marquant une avancée significative dans la technologie de l'IA.

Il est important de noter que l'accès à Gemini 1.5 Pro est réservé aux utilisateurs avec des compétences en Vertex AI et AI Studio. La plupart des utilisateurs interagissent avec les modèles linguistiques de Gemini via le chatbot Gemini, tandis que Gemini Ultra prend en charge des chatbots Gemini plus avancés. Bien que Gemini Ultra soit robuste, il ne rivalise pas avec la rapidité de Gemini 1.5 Pro.

De plus, Google a présenté des mises à jour pour un autre grand modèle d'IA, Imagen 2. Ce système avancé de génération d'images à partir de texte améliore les capacités d'image de Gemini, permettant désormais aux utilisateurs d'ajouter ou de supprimer des éléments dans les images. Google a également introduit SynthID, une fonction de filigrane numérique pour toutes les images créées avec le modèle Imagen, intégrant une marque invisible pour indiquer la source des images.

Par ailleurs, Google a donné un aperçu d'une nouvelle méthode qui intègre les réponses de l'IA avec Google Search, permettant de fournir des réponses basées sur des informations en temps réel. Cela signifie que les grands modèles linguistiques pourront offrir des données actuelles plutôt que de se fier uniquement à des informations préexistantes. Cependant, Google a décidé de restreindre Gemini dans ses réponses aux questions liées aux élections américaines de 2024, témoignant d'un engagement à traiter des informations sensibles de manière responsable.

Il est à noter que Gemini a été critiqué pour avoir généré des images inexactes de personnages historiques, ce qui nous rappelle qu'en dépit des avancées de la technologie IA, une prudence constante est nécessaire lors de la manipulation de données historiques et du monde réel.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles