Всегда ли больше — значит лучше для больших языковых моделей (LLMs)?
Ясмин Ахмад, управляющий директор по стратегии и управлению продуктами в области данных, аналитики и ИИ в Google Cloud, недавно поделилась своим мнением на эту тему на VB Transform. Её прямой ответ? «Да и нет».
Хотя большие LLM обычно показывают лучшие результаты, это не происходит бесконечно. Ахмад подчеркнула, что меньшие модели, обученные на специализированных данных в определённой области, могут превзойти свои более крупные аналоги. «Данные — это основа», отметила она, выделяя важность отраслевой информации для усиления моделей.
Такой подход способствует творчеству, эффективности и инклюзивности в компаниях. Используя ранее недоступные данные, организации могут вовлекать сотрудников новыми способами.
«Генеративный ИИ расширяет горизонты того, что могут создавать машины», сказала Ахмад. «Это стирает грань между технологией и магией, потенциально переопределяя наше представление о магии».
Необходимость новой основы для ИИ
Эффективное обучение LLM в конкретном корпоративном контексте требует применения двух основных техник: тонкой настройки и генерации, дополненной извлечением (RAG). Тонкая настройка помогает LLM понять «язык вашего бизнеса», тогда как RAG соединяет модель с актуальными данными из различных источников, таких как документы и базы данных.
«Это обеспечивает точные ответы, необходимые для финансовой аналитики, анализа рисков и многого другого», объяснила Ахмад.
Истинная сила LLM заключается в их мультимодальных возможностях, позволяя им обрабатывать разнообразные типы данных, такие как видео, текст и изображения. Поскольку 80-90% корпоративных данных являются мультимодальными, Ахмад подчеркнула важность использования LLM для эффективного управления этой информацией.
Исследование Google показало улучшение клиентского опыта на 20-30% при использовании мультимодальных данных, что усиливает способности компаний оценивать клиентские настроения и анализировать производительность продуктов в контексте рыночных тенденций.
«Теперь это не просто распознавание шаблонов», заявила Ахмад. «LLM могут понимать сложности наших организаций, обращаясь ко всем доступным данным».
Традиционные компании сталкиваются с проблемами устаревшей инфраструкутры данных, которая не может эффективно обрабатывать мультимодальную информацию. Будущее ИИ требует новой основы, созданной для этой сложности.
Промышленный ИИ: Роль взаимодействия
Ахмад также выделила важность взаимодействий вопрос-ответ для успешных LLM. Хотя взаимодействие с бизнес-данными кажется привлекательным, оно представляет собой определенные вызовы.
Например, если вы спросите коллегу о прогнозе продаж на следующий квартал без контекста, их ответы могут быть неясными. То же самое касается LLM, которым необходим семантический контекст и метаданные для предоставления точных ответов.
Анализ людьми часто включает диалог, чтобы уточнить вопросы и получить ясность. Аналогично, LLM должны развивать последовательные беседы, эволюционируя от изолированных взаимодействий к «новому поколению разговорного ИИ».
«Представьте это как личного помощника по данным», предложила она. Этот неутомимый работник может участвовать в вдумчивых обменах, обеспечивая прозрачность запросов, чтобы пользователи могли доверять результатам.
Ахмад упомянула о появлении «агентного ИИ» — систем, способных принимать решения и добиваться целей. Эти модели имитируют человеческие мыслительные процессы, разбивая задачи на подзадачи и развивая стратегическое мышление.
С учетом новых возможностей в реальном времени развитие происходит с беспрецедентной скоростью. «Будущее уже здесь, и оно порождает новые виды бизнеса», заключила Ахмад. «Мы лишь на начале того, что может предложить эта технология».