Инициативы Генеративного ИИ в Индии: Новые Разработки и Перспективы Будущего

Когда Сэм Альтман посетил Индию в прошлом году, он сказал, что стартап с бюджетом в всего 10 миллионов долларов не сможет конкурировать с OpenAI в обучении фундаментальным моделям. Его комментарий вызвал значительные обсуждения, особенно когда бывший CEO Tech Mahindra С.P. Гурнани ответил, что испытание разработки генеративного ИИ в Индии принято.

Пройдя в начало 2024 года, Индия, известная своим технологическим талантом, достигла заметных успехов в генеративном ИИ. Интересно, что первым индийским стартапом, ставящим перед собой задачу конкурировать с моделями GPT от OpenAI, стал Ola, основанный Бхавишем Агарвалом, который ранее основал компанию по вызову такси в конкурентной борьбе с Uber.

Ola Krutrim, что означает "искусственный", запустил свою первичную языковую модель, Krutrim base, и соответствующий чат-бот в прошлом месяце, планируя быстрое внедрение на рынок. Другие компании, включая Tech Mahindra и Reliance Industries, также вступают в эту гонку.

Локализованные решения в генеративном ИИ

Модели, такие как GPT от OpenAI и Llama от Meta, превосходно генерируют текст и код, но зачастую сталкиваются с трудностями в ненглийских языках, особенно в менее цифровых регионах. Чтобы справиться с этим, технологические компании в таких странах, как Южная Корея, Финляндия и Китай, начали разрабатывать собственные модели, улучшая представление локальных языков и культурных контекстов в своих обучающих данных.

Индия сталкивается с более сложной задачей, поскольку в стране проживает 1,4 миллиарда человек и насчитывается 22 официальных языка, не говоря уже о тысячах диалектов. Создание модели, которая охватывает это лингвистическое разнообразие, требует значительных ресурсов.

Агарвал основал Krutrim в апреле 2023 года, привлекая 24 миллиона долларов в виде долга от Matrix Partners. Модель стартапа обучена на двух триллионах токенов, что обеспечивает наибольшее представление индийских языков — в 20 раз больше, чем у любой существующей модели. "Krutrim обладает индийской идеей по своей сути. Он генерирует текст и код с врожденным чувством индийских культурных особенностей", — отметил Агарвал.

В настоящее время модель Ola понимает 20 индийских языков и генерирует текст на 10, включая хинди и английский. По словам компании, ее производительность в индийских языках превосходит GPT-4, хотя она уступает ему в английском. Ожидается, что этот разрыв скоро сократится.

Стартап движется поэтапно, с планами поддержки всех официально признанных индийских языков и разработки Pro-версии модели для решения сложных задач, включая текст, визуализацию и речь. Более того, команда Агарвала разрабатывает чат-бота, похожего на ChatGPT, адаптированного для индийских пользователей, который пока не доступен публично, а также проводит исследования и разработки для создания суперкомпьютера ИИ.

Конкурирующие гиганты

Пока модели Krutrim подготавливаются к реальным применениям, компания становится одной из первых индийских стартапов, которые всесторонне решают задачи генеративного ИИ. Среди прочих достойных конкурентов — Tech Mahindra и Reliance Industries.

Под руководством Гурнани Tech Mahindra запустила проект Indus, открытый крупный языковой модель (LLM), который будет запущен для внутреннего тестирования. Ожидается, что она будет представлена в феврале 2024 года и будет сосредоточена на хинди с 539 миллионами параметров и 10 миллиардами токенов на хинди и диалектах, хотя изначально не будет поддерживать все языки. "На первом этапе мы создадим LLM для хинди и более 37 диалектов, а затем расширимся на другие языки", — объяснила компания.

В то же время Reliance Industries, которая возглавила революцию 4G в Индии с Jio, объявила о планах разработки языковых моделей, адаптированных для индийского рынка. Компания сотрудничает с Nvidia для доступа к суперчипу GH200 для создания ИИ-инфраструктуры, превышающей возможности самого быстрого суперкомпьютера Индии, сотрудничая с Индийским институтом технологии в Бомбе на проекте под названием Bharat GPT. Хотя подробности скудны, кажется, что Reliance намерена интегрировать предложение GPT во все свои услуги, ориентированные на потребителей, включая Jio.

Помимо Reliance и Tech Mahindra, внимание привлек стартап Sarvam AI из Бангалора с недавно привлеченными 41 миллионом долларов. Sarvam разработал языковую модель на 7 миллиардов параметров, основанную на Llama2, и планирует запустить платформу для создания приложений генеративного ИИ для предприятий.

Поддерживаемая Google компания Corover также достигла успехов, заявляя о разработке языковой модели, поддерживающей 22 языка для разговорных чат-ботов для бизнеса.

Улучшение опыта генеративного ИИ

По мере развития ландшафта генеративного ИИ с новыми игроками и технологическими достижениями ожидается появление сложных закрытых и открытых моделей индийских языков. Эта эволюция улучшит внутренние рабочие процессы и создаст новые инновационные приложения в различных секторах.

Например, Tech Mahindra видит в LLM проекта Indus цифрового помощника для более чем 140 миллионов фермеров, предоставляющего важную информацию о кредитах, пестицидах и сельском хозяйстве на их предпочтительных языках. Это также может улучшить услуги в области здравоохранения и финансов, позволяя быстро интерпретировать местные диалекты. Потенциал применения огромен.

Будет интересно увидеть, как эти модели будут соперничать с мировыми аналогами, включая таких лидеров индустрии, как OpenAI, который близок к запуску GPT-4.5, и недавно представленную серию Gemini от Google.

Most people like

Find AI tools in YBX