Google Gemini Pro : Lancement Imminent pour les Entreprises et les Développeurs

Google dévoile son innovation la plus récente, le modèle Gemini, offrant aux entreprises et aux développeurs un aperçu de ses puissantes capacités linguistiques via une API accessible. Gemini est disponible en trois tailles : Ultra, Pro et Nano. Dès aujourd'hui, les développeurs peuvent accéder à l'API Gemini Pro via l'outil de développement web gratuit de Google, AI Studio (anciennement connu sous le nom de Makersuite), tandis que les entreprises peuvent l'intégrer à travers la plateforme Vertex AI de Google Cloud, leur permettant de créer des applications rapidement.

Google prévoit d'affiner davantage Gemini Pro en fonction des retours utilisateurs dans les prochaines semaines. "Nous avons hâte de découvrir les applications innovantes que les développeurs et entreprises créeront avec Gemini," a partagé l'entreprise dans un récent article de blog. Actuellement, Gemini Pro alimente Bard, l'IA conversationnelle de Google conçue pour concurrencer ChatGPT. Une caractéristique clé de la version initiale est sa fenêtre de contexte de 32 000 tokens, capable de traiter environ 5 333 mots. En comparaison, le GPT-4 Turbo d'OpenAI peut gérer jusqu'à 128 000 tokens. Toutefois, les itérations futures de Gemini Pro devraient considérablement élargir cette capacité.

Parmi les fonctionnalités de Gemini Pro, on trouve le support de 38 langues, l'appel de fonctions, les embeddings, la recherche sémantique et la personnalisation des connaissances. Actuellement, l'API fonctionne exclusivement avec des entrées et sorties textuelles. Cependant, un point d'accès multimodal - Gemini Pro Vision - a été lancé pour accepter à la fois des entrées textuelles et visuelles, telles que des images et vidéos, générant des sorties textuelles à partir de celles-ci.

L'API Gemini Pro est actuellement gratuite, mais elle est limitée à un maximum de 60 requêtes par minute. Une version payante sera bientôt introduite, promettant moins de restrictions avec une structure tarifaire que Google décrit comme "compétitive". Le tarif pour Gemini Pro a été établi à 0,00025 $ par millier de caractères et 0,0025 $ par image, tandis que la sortie est facturée à 0,0005 $ par millier de caractères. Les données de la version gratuite seront utilisées par Google pour améliorer ses offres, tandis que celles de la version payante resteront privées.

En plus de Gemini Pro, Google élargit sa plateforme Vertex avec de nouveaux modèles, dont Imagen 2, le dernier modèle de génération d'images AI de Google DeepMind. Ce modèle avancé de diffusion texte-image peut produire des images de haute qualité et même des logos réalistes pour les entreprises. De plus, il peut rendre du texte dans plusieurs langues.

Une autre addition majeure est MedLM, une suite de modèles fondamentaux spécifiquement ajustés pour le secteur de la santé. Basé sur le modèle Med-PaLM 2, MedLM est destiné à des applications telles que la prise de notes médicales et la réponse à des questions relatives à la santé. Actuellement, ce modèle est exclusivement accessible aux utilisateurs de Vertex basés aux États-Unis, avec des plans futurs d'élargir sa disponibilité dans les semaines à venir. Google envisage également d'incorporer des modèles basés sur Gemini dans la suite MedLM prochainement.

Enfin, l'outil Duet AI pour les développeurs est désormais accessible à tous. Cet outil de collaboration aide les développeurs à rationaliser leur processus de création d'applications et peut être intégré dans diverses interfaces Google Cloud pour la génération de code et l'assistance par chat. Au cours des prochaines semaines, Gemini sera intégré à Duet AI, qui s'étend également aux opérations de sécurité, améliorant ainsi la collaboration pour les défenseurs au sein d'une plateforme SecOps unifiée.

Avec ces outils innovants, Google ouvre la voie à une nouvelle ère d'applications pilotées par l'IA visant à accroître la productivité, la créativité et la sécurité dans divers secteurs.

Most people like

Find AI tools in YBX