OpenAI, ведущая компания в области искусственного интеллекта, представила новое поколение моделей встраивания, которые преобразуют текст в числовые представления, подходящие для различных задач машинного обучения. В дополнение к этому были представлены улучшенные версии моделей GPT-4 Turbo и GPT-3.5 Turbo, обновленные модели модерации, новые инструменты управления использованием API и снижение цены на 25% для модели GPT-3.5 Turbo.
Встраивания — это числовые последовательности, которые представляют концепции в таких материалах, как естественный язык или код. Они позволяют моделям машинного обучения эффективно понимать взаимосвязи в данных, облегчая выполнение таких задач, как кластеризация и извлечение информации. Встраивания лежат в основе таких приложений, как извлечение знаний в ChatGPT и Assistants API, а также множества инструментов для генерации, дополненных извлечением (RAG).
Новые модели встраивания OpenAI — text-embedding-3-small и text-embedding-3-large — обеспечивают лучшую производительность и доступность по сравнению с предыдущей моделью text-embedding-ada-002. Эти новые модели генерируют встраивания с учетом до 3072 измерений, что позволяет захватывать больше семантической информации и улучшать точность последующих задач.
Примечательно, что средний балл по широко используемому бенчмарку для многоязычного извлечения (MIRACL) повысился с 31.4% до 54.9% с новыми моделями, в то время как балл для английских задач (MTEB) увеличился с 61.0% до 64.6%. Цены на text-embedding-3-small были снижены в пять раз по сравнению с предшественником, что делает ее более экономически выгодной для разработчиков.
Кроме того, OpenAI усовершенствовала свои модели GPT-4 Turbo и GPT-3.5 Turbo, которые могут понимать и генерировать как естественный язык, так и код. Новые версии предлагают улучшенное следование инструкциям, возможности работы в режиме JSON, более воспроизводимые результаты и поддержку параллельного вызова функций. Также представлена новая версия GPT-3.5 Turbo с контекстом 16k, позволяющая обрабатывать более крупные входные и выходные данные по сравнению со стандартной версией 4k.
Модель модерации текста также была обновлена для лучшего обнаружения потенциально чувствительных или нежелательных текстов. Эта новая версия может обрабатывать широкий спектр языков и областей, а также предоставляет объяснения для своих классификаций.
Теперь разработчики могут более эффективно управлять API-ключами, создавая несколько ключей с различными разрешениями и областями действия, а также контролируя использование API и биллинг через OpenAI Dashboard. Ожидаемое снижение цены на 25% для модели GPT-3.5 Turbo направлено на улучшение доступности, побуждая больше разработчиков использовать этот ресурс в своих приложениях.
Эти обновления подчеркивают стремление OpenAI постоянно улучшать свои модели и услуги для лучшего обслуживания разработчиков и клиентов. Компания приветствует оценки разработчиков для помощи в доработке моделей под разнообразные сценарии использования и обещает дальнейшие улучшения, функции и инструменты в будущем.