Émergence des Défis des Modèles de Vision IA Open-Source face à ChatGPT : Points Clés à Considérer

Home Actualités IA Émergence des Défis des Modèles de Vision IA Open-Source face à ChatGPT : Points Clés à Considérer

Updated on décembre 4 2023

Nous Research, un groupe de recherche appliquée reconnu pour ses contributions dans le domaine des modèles de langage de grande taille (LLM), a lancé un nouveau modèle de vision-langage nommé Nous Hermes 2 Vision, disponible sur Hugging Face. Ce modèle open-source s'appuie sur l'OpenHermes-2.5-Mistral-7B, tout en élargissant ses capacités permettant aux utilisateurs d'entrer des images et d’extraire des informations textuelles à partir de contenus visuels. Cependant, peu après son lancement, des utilisateurs ont signalé des problèmes d'hallucinations excessives, ce qui a conduit l'entreprise à renommer le projet en Hermes 2 Vision Alpha. Une version plus stable, avec moins de bugs, est attendue prochainement.

Nous Hermes 2 Vision Alpha

Nommé d'après le messager des dieux grecs, Hermès, ce modèle de vision est conçu pour naviguer dans les complexités du discours humain avec une précision remarquable. Il intègre les données visuelles fournies par les utilisateurs avec ses connaissances apprises, ce qui lui permet de fournir des réponses détaillées en langage naturel. Par exemple, le co-fondateur de Nous, connu sous le nom de Teknium sur X, a partagé une capture d'écran démontrant la capacité du modèle à analyser une image de burger, évaluant ainsi ses implications sur la santé.

Caractéristiques Distinctives de Nous Hermes 2 Vision

Bien que ChatGPT, basé sur GPT-4V, prenne également en charge les images, Nous Hermes 2 Vision se distingue par deux améliorations principales :

1. Architecture Légère : Au lieu de se fier aux encodeurs de vision traditionnels de 3B, Nous Hermes 2 Vision utilise SigLIP-400M. Cela simplifie non seulement l'architecture du modèle, mais améliore également les performances sur les tâches de vision-langage.

2. Capacité d'Appel de Fonction : Le modèle a été entraîné sur un ensemble de données personnalisé intégrant des appels de fonction. Les utilisateurs peuvent...

Déverrouiller l'avenir de la science des matériaux : explorer les avantages et les inconvénients de la découverte alimentée par l'IA.

Fei-Fei Li et l'Impact des Femmes dans l'IA

Most people like

Pixel-Art.ai

18.2K

Élevez vos idées créatives en œuvres d'art époustouflantes et d'une précision pixel parfaite.

Art pixel AI Art Generator

AutoDraw

746.4K

AutoDraw améliore l'expérience de croquage en offrant aux utilisateurs des suggestions d'icônes et de dessins pertinentes adaptées à leurs saisies. Cet outil innovant simplifie le processus créatif, permettant à chacun de transformer rapidement ses idées en visuels soignés.

AutoDraw AI Art Generator

Stablecog

126.3K

Découvrez un outil simple, gratuit et open-source conçu pour créer des images époustouflantes générées par l'IA. Libérez votre créativité sans effort tout en profitant de la puissance de l'intelligence artificielle pour transformer vos idées en chefs-d'œuvre visuels.

Générateur d'images IA AI Art Generator

Photomath

Dévoilez les secrets pour maîtriser les mathématiques en résolvant les problèmes étape par étape. Ce guide vous accompagnera à travers les techniques et stratégies essentielles nécessaires pour relever les défis mathématiques en toute confiance. Que vous soyez un étudiant souhaitant améliorer vos compétences ou un adulte cherchant à rafraîchir ses connaissances, notre approche structurée vous guidera à chaque étape, garantissant clarté et compréhension. Plongez et découvrez comment décomposer des problèmes complexes peut conduire à des solutions efficaces !

Aide en mathématiques Homework Helper

Find AI tools in YBX