알리바바 클라우드의 Qwen2 AI 모델 소개: 128K 토큰 지원으로 향상된 성능과 긴 문맥 처리 능력

Home AI 뉴스 알리바바 클라우드의 Qwen2 AI 모델 소개: 128K 토큰 지원으로 향상된 성능과 긴 문맥 처리 능력

오늘 Alibaba Cloud는 Qwen이라는 AI 오픈 소스 모델 시리즈의 업그레이드, Qwen2를 발표했습니다. 이번 업데이트는 다섯 가지 사전 훈련된 모델을 제공하며, 각기 다른 크기로 코드 및 수학 기능을 포함한 여러 능력에서 성능을 크게 향상시킵니다. 또한 이 모델들은 긴 컨텍스트 길이도 지원합니다.

Qwen2 시리즈은 Qwen2-0.5B, Qwen2-1.5B, Qwen2-7B, Qwen2-57B-A14B, Qwen2-72B의 다섯 가지 모델로 구성됩니다. 특히 Qwen2-72B-Instruct 모델은 최대 128K 토큰의 컨텍스트 길이를 처리할 수 있어, 사용자에게 광범위한 텍스트 처리 능력을 제공합니다.

훈련 데이터 면에서 Qwen2 시리즈는 중국어와 영어 외에 27개 추가 언어의 고품질 데이터를 통합하여 다국어 능력을 크게 향상시켰습니다. 모든 모델은 Gradient-based Quantization Aware Training (GQA) 기술을 활용하여 추론 속도를 높이고 메모리 사용량을 줄여, 보다 효율적이고 안정적인 사용자 경험을 제공합니다.

평가 결과에 따르면 Qwen2 시리즈의 대형 모델은 현저한 개선을 보였습니다. 특히 Qwen2-72B 모델은 자연어 이해, 지식 처리, 코드 작성, 수학 및 다국어 능력에서 Llama-3-70B와 Qwen1.5-110B와 같은 주요 모델들을 능가했습니다. 이는 Qwen2 시리즈가 AI 모델 개발에서 선도적인 위치를 차지하고 있음을 강조합니다.

Alibaba Cloud의 AI 혁신과 발전에 대한 헌신의 일환으로 Qwen2 시리즈의 출시가 이루어졌으며, 이는 진보적이고 효율적인 AI 모델을 도입할 뿐만 아니라 AI 분야에서 Alibaba Cloud의 기술력과 혁신 능력을 보여줍니다. 앞으로 Qwen으로부터 더 뛰어난 AI 모델과 기술이 출시되어 이 분야의 발전에 기여하기를 기대합니다.

애플과 OpenAI가 ChatGPT-4o를 공개했습니다: iOS 18 및 기타 시스템 경험 향상

OPPO, 스마트폰 AI 경험 강화: 모든 제품군에 생성적 AI 통합 목표

Most people like

Height

195.3K

Height는 팀 협업을 강화하고 조직을 간소화하기 위해 설계된 강력한 프로젝트 관리 도구입니다. 사용하기 쉬운 기능을 통해 Height는 팀이 효율적으로 협력할 수 있도록 지원하며, 모든 팀원이 제 역할을 다하고 프로젝트가 원활하게 완료될 수 있도록 합니다.

프로젝트 관리 AI Task Management

Univerbal

18.1K

AI 튜터와 함께 언어 학습의 힘을 끌어내세요. 여러분의 기술을 변화시키고 유창함을 향한 여정에서 맞춤형 지도를 경험하세요.

언어 학습 AI Grammar Checker

FlareLane

12.9K

자동화된 여정을 통해 전환율을 향상시키세요. 맞춤형 자동화를 활용하여 마케팅 전략을 변화시키고 의미 있는 결과를 이끌어내는 방법을 알아보세요.

고객 참여 AI Analytics Assistant

Stable Diffusion 3 Free Online

444.8K

첨단 AI의 힘을 활용하여 멋진 비주얼을 만들어보세요. 최첨단 인공지능 도구가 여러분의 창의적인 프로젝트를 어떻게 변화시키고, 디자인 능력을 향상시키며, 독특한 예술적 표현을 영감을 주는지 알아보세요. AI 기반 기술로 디지털 예술의 미래를 탐험하고, 상상력을 새로운 차원으로 끌어올리세요.

AI 기반 이미지 생성 Text to Image

Find AI tools in YBX