На VB Transform 2024 Дэвид Кокс из IBM подчеркнул важность открытых инноваций в генеративном ИИ для бизнеса, опираясь на длительную приверженность компании открытым технологиям. В качестве Вице-президента по моделям ИИ и Директора MIT-IBM Watson AI Lab, Кокс представил видение, которое как ставит вызовы, так и вдохновляет технологическую отрасль.
«Открытые инновации — это путь человеческого прогресса», — отметил Кокс, добавив, что этот концепт жизненно важен для технологического развития. Он акцентировал внимание на важности текущего момента в развитии ИИ: «Мы должны принимать решения о том, куда инвестировать и как избежать зависимости».
Кокс оспорил упрощенное бинарное восприятие открытости в ИИ, заявив: «Открытость не имеет единого значения. Она включает множество аспектов». Он указал на развивающуюся экосистему открытых моделей от различных источников, включая технологических гигантов, университеты и даже правительства.
Тем не менее, он выразил обеспокоенность по поводу качества открытости во многих крупных языковых моделях (LLMs). «В некоторых случаях вы просто получаете набор чисел, не зная, как они были получены», — предостерег он. Эта недостаточная прозрачность, по его словам, усложняет воспроизводимость и подрывает основные принципы открытого кода.
Кокс провел параллели с традиционным открытым программным обеспечением, выделив характеристики, способствовавшие его успеху: частые обновления, структурированные циклы выпусков, патчи безопасности и активное участие сообщества. «Все четко определено, что позволяет вносить поэтапные вклады как от компаний, так и от более широкого сообщества», — отметил он.
Он раскритиковал текущее состояние открытых LLM, заявив: «Несмотря на впечатляющие показатели, они часто лишены основных атрибутов открытого кода». Кокс указал на непоследовательные графики выпуска некоторых провайдеров, когда модели иногда не получают обновления после первоначального запуска. Эта непоследовательность, по его мнению, подрывает истинную сущность открытого программного обеспечения и ограничивает инновации в ИИ, движимые сообществом.
Кокс подчеркнул стремление IBM к прозрачности через их серию открытых моделей ИИ Granite. «Мы раскрываем всю информацию о модели», — заявил он, выделяя, что они открыли весь код обработки для обеспечения качества и фильтрации неприемлемого контента.
Кокс утверждал, что этот уровень открытости не представляет угрозы для производительности. Он привел бенчмарки, показывающие модели Granite как передовые, утверждая: «Вам не нужно жертвовать прозрачностью ради отличной производительности».
Он предложил новый взгляд на LLM, рассматривая их как представления данных, а не просто как инструменты для общения. С учетом прогнозов, что LLM вскоре охватят почти все общедоступные данные, Кокс отметил значительный пробел: внутри этих моделей накапливаются в основном общие знания, в то время как уникальные корпоративные данные остаются без представительства.
Чтобы решить эту проблему, он предложил миссию по интеграции корпоративных данных в базы моделей, чтобы раскрыть их полный потенциал. Хотя существуют такие техники, как дополненная генерация данных (RAG), Кокс утверждал, что они часто не используют уникальные корпоративные знания и собственную информацию.
Кокс изложил трехступенчатый подход для компаний: определение доверенной базовой открытой модели, создание нового представления бизнес-данных и затем развертывание и масштабирование для создания ценности. Он акцентировал внимание на необходимости прозрачности при выборе базовой модели, особенно в регулируемых отраслях, отметив, что многие провайдеры моделей не раскрывают свои данные.
Сложность заключается в эффективной интеграции собственных данных с базовой моделью. Кокс заявил, что выбранная базовая модель должна демонстрировать высокую производительность, быть прозрачной и открытой, чтобы обеспечить необходимые контроль и гибкость для компаний.
Чтобы реализовать свою концепцию, Кокс представил InstructLab, совместную инициативу IBM и Red Hat, созданную для интеграции корпоративных знаний в модели ИИ. «InstructLab позволяет создавать подлинные открытые вклады для LLM», — объяснил он.
Проект использует структурированную таксономию мировых знаний и навыков, позволяя пользователям точно повышать производительность модели. Этот структурированный подход облегчает интеграцию специфических идей из бизнеса, снижая барьеры для экспертов в области.
InstructLab использует модель «учителя» для генерации синтетических обучающих данных, безупречно сочетая собственные данные с базовыми моделями, не ухудшая производительность. Примечательно, что цикл обновления модели сокращается до одного дня, что контрастирует с традиционными длительными циклами выпуска.
Инсайты Кокса и InstructLab от IBM сигнализируют о сдвиге в принятии ИИ для бизнеса, переходя от общих моделей к индивидуальным решениям, отражающим уникальный опыт каждой компании. По мере развития технологий конкурентное преимущество может зависеть от способности эффективно превращать институциональные знания в аналитическую информацию на основе ИИ. Следующая глава ИИ — это не просто более умные машины; это машины, которые понимают бизнес так же глубоко, как и их пользователи.