차세대 오픈소스 AI 비전 모델이 ChatGPT에 도전: 고려해야 할 핵심 이슈

Home AI 뉴스 차세대 오픈소스 AI 비전 모델이 ChatGPT에 도전: 고려해야 할 핵심 이슈

Nous Research, 누구 연구,는 대형 언어 모델(LLM) 분야에서 인정받는 민간 응용 연구 그룹으로, 새로운 비전-언어 모델인 Nous Hermes 2 Vision을 Hugging Face 플랫폼에 공개했습니다. 이 오픈 소스 모델은 이전의 OpenHermes-2.5-Mistral-7B를 기반으로 하여 사용자가 이미지를 입력하고 시각적 콘텐츠에서 텍스트 정보를 추출할 수 있는 기능을 확장했습니다. 하지만 출시 직후 사용자는 과도한 환각 문제를 보고하여 이 프로젝트는 Hermes 2 Vision Alpha로 이름이 변경되었습니다. 더 안정적인 버전이 곧 출시될 예정입니다.

Nous Hermes 2 Vision Alpha

그리스 신들의 전령 헤르메스의 이름을 딴 이 비전 모델은 인간 담론의 복잡성을 놀라운 정밀도로 탐색하도록 설계되었습니다. 사용자가 제공한 시각적 데이터와 학습된 지식을 통합하여 상세하고 자연스러운 언어 응답을 제공합니다. 예를 들어, Nous의 공동 창립자인 Teknium이 X에서 모델이 햄버거 이미지를 분석하여 건강 영향을 평가하는 스크린샷을 공유했습니다.

Nous Hermes 2 Vision의 독특한 특징

ChatGPT가 GPT-4V를 기반으로 이미지 프롬프트를 지원하는 반면, Nous Hermes 2 Vision은 두 가지 주요 개선 사항으로 차별화됩니다:

1. 경량 아키텍처: Nous Hermes 2 Vision은 전통적인 3B 비전 인코더 대신 SigLIP-400M을 사용하여 모델 아키텍처를 단순화하고 경량화했습니다. 이를 통해 비전-언어 작업의 성능도 향상되었습니다.

2. 함수 호출 기능: 이 모델은 함수 호출이 포함된 사용자 정의 데이터셋으로 학습되어, 사용자가 이를 활용할 수 있습니다.

재료 과학의 미래를 여는 열쇠: AI 기반 발견의 장단점 탐구

페이페이 리와 인공지능에서 여성의 영향

Most people like

Wordtune

2.3M

워드튠은 글을 개선하기 위해 재작성 및 양식을 제안하는 지능형 AI 작문 도우미입니다. 고급 알고리즘을 통해 워드튠은 생각을 명확하고 효과적으로 표현할 수 있도록 도와줍니다.

AI 글쓰기 도구 Writing Assistants

ChartAI

14.7K

ChartAI는 ChatGPT의 힘을 활용하여 사용자가 차트와 도표를 손쉽게 생성하고 해석할 수 있도록 돕습니다. 직관적인 기능으로 ChartAI는 복잡한 데이터를 시각적으로 매력적이고 이해하기 쉬운 형태로 변환하여 데이터 분석 경험을 향상시킵니다.

차트 AI Charting

Melodio AI

36.2K

당신의 청취 경험을 향상시키기 위해 설계된 궁극적인 개인화 AI 음악 동반자를 만나보세요. 이 혁신적인 도구는 당신의 독특한 취향에 맞춰 음악 추천을 조정하여 특별한 사운드트랙을 만들어줍니다. 첨단 알고리즘을 통해 선호도를 학습하고, 당신의 기분과 잘 어우러지는 맞춤형 재생 목록을 제공합니다. 모든 음이 당신의 vibe에 완벽하게 어울리도록 보장합니다. 음악의 미래를 받아들이고, 음악 여정에 따라 진화하는 AI 동반자와 함께 매세션을 독특한 경험으로 만들어보세요.

개인화된 음악 AI Music Generator

MealPractice

45.2K

수고 없이 요리 경험을 간소화하세요. 개인 맞춤형 AI 생성 레시피를 활용한 손쉬운 레시피 추적과 식사 계획 기능이 제공됩니다.

식사 계획 AI Recipe Assistant

Find AI tools in YBX