Aufkommende Open-Source-KI-Visionsmodelle stellen eine Herausforderung für ChatGPT dar: Wichtige Aspekte zu beachten

Home KI-Nachrichten Aufkommende Open-Source-KI-Visionsmodelle stellen eine Herausforderung für ChatGPT dar: Wichtige Aspekte zu beachten

Updated on Dezember 4 2023

Nous Research, eine private angewandte Forschungsgruppe, die für ihre Beiträge im Bereich der großen Sprachmodelle (LLM) anerkannt ist, hat ein neues Vision-Language-Modell namens Nous Hermes 2 Vision eingeführt, das auf Hugging Face verfügbar ist. Dieses Open-Source-Modell baut auf dem vorherigen OpenHermes-2.5-Mistral-7B auf und erweitert dessen Möglichkeiten, indem es Benutzern ermöglicht, Bilder einzugeben und Textinformationen aus visuellen Inhalten zu extrahieren. Kurz nach dem Start berichteten Nutzer jedoch über übermäßige Halluzinationen, was das Unternehmen veranlasste, das Projekt in Hermes 2 Vision Alpha umzubenennen. Eine stabilere Version mit weniger Fehlern wird in Kürze erwartet.

Nous Hermes 2 Vision Alpha

Benannt nach dem griechischen Götterboten Hermes, wurde dieses Vision-Modell entwickelt, um die Komplexitäten menschlicher Kommunikation mit bemerkenswerter Präzision zu bewältigen. Es integriert die visuellen Daten der Nutzer mit seinem erlernten Wissen, was es ihm ermöglicht, detaillierte, eine natürliche Sprache verwendende Antworten zu liefern. Zum Beispiel teilte der Mitbegründer von Nous, bekannt als Teknium auf X, einen Screenshot, der die Fähigkeit des Modells veranschaulicht, ein Bild eines Burgers zu analysieren und dessen gesundheitliche Auswirkungen zu bewerten.

Besondere Merkmale von Nous Hermes 2 Vision

Während ChatGPT, das auf GPT-4V basiert, ebenfalls Bildanfragen unterstützt, hebt sich Nous Hermes 2 Vision durch zwei Hauptmerkmale ab:

1. Leichte Architektur: Anstelle traditioneller 3B-Visionskodierer verwendet Nous Hermes 2 Vision SigLIP-400M. Dies vereinfacht nicht nur die Architektur des Modells und macht es leichter, sondern verbessert auch die Leistung bei vision-language Aufgaben.

2. Funktionsaufruf-Fähigkeit: Das Modell wurde auf einem maßgeschneiderten Datensatz mit Funktionsaufrufen trainiert. Nutzer können eine...

Die Zukunft der Materialwissenschaften Entfalten: Vor- und Nachteile der KI-gestützten Entdeckung im Fokus

Fei-Fei Li und der Einfluss von Frauen in der KI

Most people like

Baked Studio

37.7K

Sind Sie ein Startup, das seine Marke mit herausragendem Design aufwerten möchte? Ein Design-Abonnement bietet Ihnen laufenden Zugang zu professionellen Kreativdiensten, die auf Ihre sich entwickelnden Bedürfnisse zugeschnitten sind. Dieser innovative Ansatz spart nicht nur Zeit und Geld, sondern sorgt auch dafür, dass Ihre Marke in der heutigen dynamischen Marktwelt frisch und wettbewerbsfähig bleibt. Entdecken Sie, wie ein Design-Abonnement der Wendepunkt sein kann, den Ihr Startup benötigt, um Ihr Publikum visuell zu fesseln und Wachstum zu fördern.

Produktdesign Design Assistant

Reescribir Textos - Cambiador de Palabras

187.3K

Text Neuschreiben ist ein innovatives Werkzeug, das deine Texte in Sekundenschnelle verwandelt und das Umformulieren von Inhalten schnell und effizient gestaltet.

Wortwechsler AI Rewriter

Vendasta

160.7K

Wir präsentieren eine KI-gesteuerte SaaS-Plattform, die entwickelt wurde, um den Verkauf Ihrer digitalen Produkte effektiv zu steigern und auszubauen.

KI-gestützt AI Advertising Assistant

SHRED: Home & Gym Workouts App

33.4K

Präsentation unserer innovativen, KI-gestützten Personal-Training-App, die darauf ausgelegt ist, Ihr Fitnesserlebnis zu Hause oder im Fitnessstudio zu optimieren. Dieses hochmoderne Tool passt die Trainingspläne an Ihre individuellen Ziele an und stellt sicher, dass Sie aus jeder Einheit das Beste herausholen. Egal, ob Sie Anfänger oder erfahrener Sportler sind, unsere App passt sich Ihren Bedürfnissen an und bietet maßgeschneiderte Routinen, die Ergebnisse maximieren und Sie motivieren, auf Kurs zu bleiben. Machen Sie sich bereit für eine transformative Fitnessreise, die Ihnen direkt zur Verfügung steht!

Fitness-App Fitness

Find AI tools in YBX