Microsoft объявила о запуске Phi-3 — мощной языковой модели с 3 миллиардами параметров, обладающей продвинутыми навыками рассуждений, сопоставимыми с более крупными моделями, но доступной по значительно меньшей цене. Разработанная Microsoft Research, Phi-3 станет доступна на платформе Azure AI, что позволит компаниям использовать передовую обработку естественного языка для различных задач.
"Важно то, что у нас есть компактная модель с возможностями, сопоставимыми с гораздо большими моделями, близко подходящими к производительности GPT-3.5", — отметил Себастьен Бюбек, вице-президент Microsoft по генеративному ИИ. "Наши достижения превзошли первоначальные ожидания, поскольку никто не предсказывал такой объём, необходимый для достижения этих возможностей."
Phi-3 представляет собой очередной этап в исследовании компактных языковых моделей Microsoft. Начав с Phi-1 в прошлом году и продолжив с Phi-1.5 и Phi-2, серия Phi продемонстрировала выдающиеся результаты в кодировании, логическом мышлении и тестах на естественный язык с моделями от 1 до 2 миллиардов параметров.
Экономичные AI-решения для бизнеса
"Когда клиенты видят возможное, они стремятся к инновациям", — сказал Эрик Бойд, корпоративный вице-президент платформы Azure AI. "На Azure мы способствуем разработке приложений генеративного ИИ, отвечающим их потребностям. Мы всегда будем предлагать самые передовые модели, расширяя границы инноваций и предоставляя решения на любой бюджет."
С Phi-3 Microsoft создала универсальную модель с 3 миллиардами параметров, которая напоминает возможности ведущих моделей, таких как GPT-3.5 от OpenAI, но по более низкой цене и способную работать на стандартном оборудовании, включая смартфоны. Это достижение в эффективности параметров открывает трансформационные возможности ИИ для бизнеса, которые раньше были слишком дорогими для реализации.
Обязанность перед ответственным ИИ
Microsoft при разработке Phi-3 приоритетно учитывала принципы ответственного ИИ. Данные для обучения модели прошли тщательную проверку на токсичность и предвзятость, дополнительно были введены меры безопасности. Такой подход позволяет компаниям — особенно в регулируемых отраслях — уверенно использовать продвинутые функции Phi-3.
С технической точки зрения Phi-3 работает на ONNX Runtime, оптимизированном для графических процессоров NVIDIA, что позволяет распределённое развертывание на нескольких графических процессорах или машинах для максимизации пропускной способности. Его архитектура использует эффективные механизмы внимания и оптимизированную числовую точность, обеспечивая высокую производительность при относительно компактном размере модели.
Овладевая продвинутым естественным языковым ИИ
"Преимущество этого базового слоя в меньшей модели заключается в том, что компании могут адаптировать его под свои данные для достижения исключительных результатов в конкретных областях", — объяснил Бюбек. "Даже в специализированных областях общая интеллектуальная способность остаётся важной."
Введение Phi-3 и его интеграция в платформу Azure AI знаменует собой значительный шаг вперёд в доступности и экономичности мощностей больших языковых моделей для бизнеса любого размера. В то время как организации стремятся к внедрению ИИ и использованию ценности неструктурированных данных, адаптированные модели, такие как Phi-3, играют ключевую роль в достижении этой цели.