Крупные языковые модели (LLM) сильно зависят от качественных обучающих данных. Немногие организации имеют такое количество данных, как Stack Overflow — ведущая платформа для обмена знаниями, которой ежемесячно пользуются более 100 миллионов разработчиков.
Сегодня Stack Overflow объявила о партнерстве с Google Cloud для улучшения возможностей искусственного интеллекта (ИИ) для разработчиков по всему миру. Ключевым элементом этого сотрудничества является интеграция обширной базы знаний Stack Overflow в инструменты ИИ Google Cloud, включая Gemini и Cloud Console. Эта интеграция обеспечит разработчиков прямым доступом к актуальным ответам, фрагментам кода и документации от сообщества Stack Overflow. Партнерство подчеркивает растущую тенденцию, когда поставщики LLM, такие как OpenAI, сотрудничают с поставщиками контента для усиления обучения генеративного ИИ.
Новая интеграция использует OverflowAPI, которая в будущем может быть расширена для других поставщиков LLM.
«Сегодня Stack Overflow запускает программу, которая предоставляет ИИ-компаниям доступ к своей базе знаний через новый API», — сказал Прашант Чандрасекар, генеральный директор Stack Overflow. «Google — наш партнер по запуску, использующий данные Stack Overflow для улучшения Gemini для Google Cloud и доставки проверенных ответов в консоли Google Cloud».
Преимущества OverflowAPI для Google и Stack Overflow
Доступ Google к обширному информационному репозиторию Stack Overflow представляет собой значительную возможность, хотя точная стоимость остается нераскрытой. Чандрасекар отказался комментировать финансовые условия партнерства.
С помощью OverflowAPI Google может постоянно получать доступ к общедоступным данным Stack Overflow. Это включает более 58 миллионов вопросов и ответов, миллионы комментариев пользователей и метаданные, такие как голоса и изменения.
Это партнерство выгодно для обеих сторон: Stack Overflow будет всё активнее использовать технологии Google Cloud в качестве своей основной платформы хостинга. Конкретные технологии и услуги еще обсуждаются.
Важно, что это партнерство не ограничивает возможности Stack Overflow сотрудничать с другими поставщиками LLM. «Это не эксклюзивно для Google; у них нет доступа к конфиденциальным данным Stack Overflow, включая данные клиентов или личную информацию пользователей», — уточнил Чандрасекар.
Дополнение OverflowAI новым OverflowAPI
Партнерство с Google знаменует собой еще один шаг в исследовании генеративного ИИ от Stack Overflow. В июле 2023 года компания запустила инициативу OverflowAI. Чандрасекар отметил, что новый API дополняет OverflowAI, улучшая возможности ИИ и машинного обучения (ML) для Stack Overflow for Teams и публичной платформы. Примеры инициатив OverflowAI включают Stack Overflow для Visual Studio Code, улучшенный поиск и приложение автоответчик для Slack.
Противоположно этому, OverflowAPI служит постоянной точкой доступа к данным для обучения и дообучения крупных языковых моделей. «Наша цель с OverflowAI прошлым летом заключалась в том, чтобы дать возможность разработчикам внести вклад в основу генеративного ИИ, оставаясь неотъемлемой частью его будущего», — сказал Чандрасекар. «Сегодняшнее объявление отмечает сотрудничество между самой удобной для разработчиков облачной платформой и ведущей платформой знаний для разработчиков в мире».