Галилео революционизирует оценку ИИ с помощью Luna: прорыв для бизнеса
Галилео, лидер в области генеративного ИИ для предприятий, представил Luna — революционный набор моделей оценки (EFMs), предназначенный для изменения подхода компаний к оценке своих генеративных ИИ-систем. Luna решает ключевые проблемы — скорость, стоимость и точность, которые ранее сдерживали внедрение генеративного ИИ в производственные процессы.
«Мы создали Luna, чтобы преодолеть недостатки существующих методов оценки GenAI, которые часто медлительны, дорогие и неточные», — сказал Викарам Чаттерджи, соучредитель и генеральный директор Галилео. «Мы осознали необходимость в сверхнизкой задержке, экономически эффективных и высокоточных оценках в производственной среде».
Важный этап в оценке ИИ
Запуск Luna — это ключевой шаг для Галилео, который активно развивает генеративный ИИ для предприятий с начала 2021 года. Преданность компании совершенствованию оценки ИИ очевидна благодаря почти годичным интенсивным исследованиям и разработкам, завершившимся созданием Luna.
Luna продемонстрировала превосходные результаты на бенчмарке, достигнув значения AUROC в 0.78. Это превосходит таких ведущих конкурентов, как GPT-3.5, Trulens Groundedness и RAGAS Faithfulness.
Модели, созданные для переосмысления стандартов оценки
В основе инноваций Luna лежат специально разработанные маленькие языковые модели, предназначенные для выполнения задач оценки, таких как выявление галлюцинаций, оценка качества контекста, предотвращение утечек данных и распознавание злонамеренных запросов. Эта специализированная направленность позволяет Luna превосходить по трем ключевым метрикам: скорости, стоимости и точности.
«Используя адаптированные маленькие языковые модели, Luna делает оценки на 97% дешевле и в 11 раз быстрее, чем с помощью GPT-3.5», — объяснил Чаттерджи. Кроме того, Luna превосходит предыдущие методы в обнаружении таких проблем, как галлюцинации и персональная идентифицируемая информация (PII), на 20%.
В ходе анализа затрат на оценку 1 миллиона запросов в месяц Luna затрачивает всего 175 долларов, что значительно более экономично по сравнению с GPT-3.5 (6,248 долларов), RAGAS Faithfulness (7,994 долларов) и Trulens Groundedness (16,641 долларов).
Инновации без традиционных датасетов
Яркой особенностью Luna является ее способность работать без традиционных эталонных датасетов. Используя предварительно обученные модели оценки, усовершенствованные на разнообразных специфичных для домена наборах данных, Luna упрощает процесс оценки, устраняя необходимость в затратных пользовательских тестовых наборах.
Потенциальные сферы применения Luna обширны. Чаттерджи отметил ее эффективность в отраслях, требующих высокой надежности, таких как здравоохранение, финансы и телекоммуникации. «Luna особенно мощна для масштабных корпоративных приложений, обрабатывающих миллионы запросов в месяц», — добавил он.
Непревзойденная скорость и постоянное совершенствование
Luna от Галилео предлагает исключительную скорость, обрабатывая один запрос всего за 0.232 секунды, что является значительным улучшением по сравнению с конкурентами, такими как GPT-3.5 (2.5 секунды) и RAGAS Faithfulness (5.4 секунды).
Сценарии использования Luna варьируются от мониторинга вывода ИИ в реальном времени до обеспечения безопасности взаимодействия чат-ботов. С продуктом Fine Tune от Галилео Luna может быть настроена для удовлетворения специфических потребностей клиентов, достигая уровней точности 95% и выше в критически важных секторах, включая фармацевтику и финансовые услуги.
По мере эволюции ландшафта генеративного ИИ Галилео продолжает внедрять новшества с Luna, сосредотачивая усилия на расширении поддержки задач, увеличении точности и дальнейшем снижении затрат и задержек.
«Галилео стремится продвигать оценку ИИ, помогая организациям внедрять надежные ИИ-решения», — заявил Чаттерджи. «По мере развития генеративного ИИ мы будем предоставлять клиентам передовые возможности, вызывающие доверие у пользователей».
С запуском Luna Галилео укрепил свои позиции как пионер в оценке генеративного ИИ для предприятий. С учетом стремления компаний использовать потенциал генеративного ИИ, быстрые, экономически эффективные и точные оценки Luna станут важным шагом в широкомасштабном применении этой революционной технологии.