Модель искусственного интеллекта Llama от Groq с открытым исходным кодом обошла GPT-4o и Claude по функциональным возможностям, заняв первое место в рейтинге.

Groq, инновационный стартап в области AI-аппаратного обеспечения, представил две модели языков, разработанные с открытым исходным кодом, которые превосходят аналоги от крупных технологических компаний благодаря своим специализированным возможностям работы с инструментами. Модель Llama-3-Groq-70B-Tool-Use заняла первое место в рейтинге Berkeley Function Calling Leaderboard (BFCL), обойдя закрытые модели от OpenAI, Google и Anthropic.

Рик Ламмерс, руководитель проекта в Groq, поделился этим достижением в посте на X.com: «Я горжусь тем, что могу представить модели Llama 3 Groq Tool Use 8B и 70B. Эта полная тонкая настройка открытого кода Llama 3 достигла первой позиции в BFCL, обойдя все другие модели, включая закрытые, такие как Claude Sonnet 3.5, GPT-4 Turbo, GPT-4o и Gemini 1.5 Pro».

Более крупная модель с 70 миллиардами параметров продемонстрировала впечатляющую общую точность 90.76% на BFCL, а меньшая модель с 8 миллиардами параметров набрала 89.06%, заняв третье место. Эти результаты показывают, что модели с открытым исходным кодом могут не только конкурировать, но и превосходить закрытые аналоги в определенных задачах.

Модели Groq были разработаны в сотрудничестве с исследовательской компанией в области ИИ Glaive, используя полную тонкую настройку и оптимизацию прямых предпочтений (DPO) на базе Meta’s Llama-3. Команда гарантировала, что для тренировки использовались только этически сгенерированные синтетические данные, что решает проблемы конфиденциальности и переобучения.

Это развитие знаменует собой важное изменение в ландшафте AI. Достигнув высокого уровня производительности, используя исключительно синтетические данные, Groq оспаривает мнение о том, что для создания продвинутых моделей ИИ необходимы огромные объемы данных из реального мира. Этот инновационный подход может снизить проблемы конфиденциальности и сократить экологический след, часто связанный с массовым обучением на данных. Более того, он открывает возможности для создания специализированных AI-моделей в областях, где реальные данные ограничены или чувствительны.

Groq сделала свои модели доступными через API Groq и платформу Hugging Face, ведущую в области машинного обучения. Эта доступность обещает стимулировать инновации в таких сферах, как автоматизированное кодирование и анализ данных.

Для дальнейшего вовлечения сообщества Groq запустила публичную демонстрацию на Hugging Face Spaces, позволяя пользователям взаимодействовать с моделью и оценивать ее возможности работы с инструментами. Демонстрация, разработанная в сотрудничестве с Gradio, который Hugging Face приобрела в декабре 2021 года, заслужила положительные отзывы от исследователей и разработчиков, стремящихся исследовать потенциал моделей.

Стратегия Groq с открытым исходным кодом резко контрастирует с закрытыми системами, используемыми крупными технологическими компаниями, что потенциально может побудить лидеров отрасли к большей прозрачности и ускорению разработки AI. Выпуск этих высокопроизводительных моделей с открытым исходным кодом утверждает позицию Groq как значимого игрока в области AI. По мере того как исследователи, бизнес и законодатели рассматривают последствия этой технологии, ясно, что потенциальные возможности для повышения доступности и инноваций в AI остаются обширными. Успех Groq может ознаменовать новую эру в разработке и внедрении AI, демократизируя передовые возможности и способствуя более разнообразной и инновационной экосистеме.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles