Новый открытый ИИ-модель визуализации бросает вызов ChatGPT: ключевые проблемы для обсуждения

Home Новости ИИ Новый открытый ИИ-модель визуализации бросает вызов ChatGPT: ключевые проблемы для обсуждения

Updated on декабрь 4 2023

Nous Research, частная прикладная исследовательская группа, известная своими достижениями в области крупных языковых моделей (LLM), представила новую модель визуального языка под названием Nous Hermes 2 Vision, доступную на платформе Hugging Face. Эта модель с открытым исходным кодом основывается на предыдущей версии OpenHermes-2.5-Mistral-7B и расширяет свои возможности, позволяя пользователям вводить изображения и извлекать текстовую информацию из визуального контента. Однако вскоре после запуска пользователи сообщили о проблемах с галлюцинациями, что побудило компанию переименовать проект в Hermes 2 Vision Alpha. Ожидается, что в ближайшее время выйдет более стабильная версия с меньшим числом ошибок.

Nous Hermes 2 Vision Alpha

Названная в честь греческого посланника богов Гермеса, эта модель визуального языка разработана для точного анализа сложных человеческих дискурсов. Она объединяет визуальные данные, предоставленные пользователями, с усвоенными знаниями, что позволяет ей выдавать детализированные и естественные ответные реакции. Например, соучредитель Nous, известный как Teknium в X, поделился скриншотом, демонстрирующим способность модели анализировать изображение бургера и оценивать его влияние на здоровье.

Уникальные особенности Nous Hermes 2 Vision

Хотя ChatGPT, основанный на GPT-4V, также поддерживает ввод изображений, Nous Hermes 2 Vision выделяется двумя основными преимуществами:

1. Легкая архитектура: Вместо традиционных 3B визуальных кодеров, Nous Hermes 2 Vision использует SigLIP-400M. Это не только упрощает архитектуру модели, делая ее легче, но и улучшает производительность в задачах взаимодействия визуального языка.

2. Возможность вызова функций: Модель была обучена на специализированном наборе данных с функцией вызова. Пользователи могут использовать функцию...

Как CEO Arnica предсказывает влияние генеративного ИИ на решения безопасности DevOps

Фэй-Фэй Ли и влияние женщин в ИИ

Most people like

LlamaChat

16.3K

Ведите живые беседы с вашими любимыми AI-моделями, включая LLaMA, Alpaca и GPT4All, на LlamaChat. Ощутите интуитивные взаимодействия и узнайте возможности этих продвинутых чат-ботов уже сегодня!

чат-приложение AI Developer Tools

Groq

Groq — Быстрый ИИ-инференс. Groq поддерживает передовые открытые модели ИИ.

Модели ИИ Large Language Models (LLMs)

Heidi

561.3K

В современном быстром темпе здравоохранения врачи часто перегружены административными задачами, отвлекающими их от ухода за пациентами. Здесь на помощь приходит технология искусственного интеллекта для ведения записей — революционное решение, созданное для упрощения документации и повышения эффективности. Используя интеллектуальную транскрипцию и решения для ввода данных, ИИ-свидетели могут сэкономить врачам дни ценного времени, позволяя им сосредоточиться на действительно важном: обеспечении исключительной помощи пациентам.

ИИ Письменник Healthcare

Background Removal

14.2K

Революционный API для легкого удаления фона с изображений.

удаление фона Other

Find AI tools in YBX