Quando Sam Altman visitou a Índia no ano passado, comentou que uma startup com apenas 10 milhões de dólares não conseguiria competir com a OpenAI no treinamento de modelos fundamentais. Essa declaração gerou uma discussão significativa, especialmente quando CP Gurnani, ex-CEO da Tech Mahindra, afirmou que o desafio de desenvolver IA generativa na Índia havia sido aceito.
Avançamos para o início de 2024, e a Índia — um país conhecido por seu talento tecnológico — fez avanços notáveis em IA generativa. Curiosamente, a primeira startup indiana a enfrentar os modelos GPT da OpenAI não é a Tech Mahindra, mas sim a Ola, liderada por Bhavish Aggarwal, que anteriormente fundou a empresa de transporte para competir com a Uber.
A Ola Krutrim, que significa "artificial", lançou seu modelo inicial de linguagem, o Krutrim base, e um chatbot correspondente no mês passado, com planos para sua adoção mainstream em breve. Outros atores, como a Tech Mahindra e a Reliance Industries, também estão entrando na corrida.
Experiências Localizadas em IA Generativa
Embora modelos como o GPT da OpenAI e o Llama da Meta sejam excelentes na geração de texto e código, muitas vezes têm dificuldades com idiomas que não são o inglês, especialmente aqueles com menor representação digital. Para enfrentar isso, empresas de tecnologia em países como Coreia do Sul, Finlândia e China começaram a desenvolver modelos próprios que ampliam a representação de idiomas locais e contextos culturais em seus dados de treinamento.
A Índia enfrenta um desafio mais complexo, abrigando 1,4 bilhão de pessoas e 22 idiomas oficiais, além de milhares de dialetos. Criar um modelo que abarque essa diversidade linguística é tanto intimidante quanto custoso.
Aggarwal fundou a Krutrim em abril de 2023, levantando 24 milhões de dólares em dívida com a Matrix Partners. O modelo da startup é treinado em dois trilhões de tokens, ostentando a maior representação de idiomas indianos—20 vezes mais do que qualquer modelo existente. “Krutrim tem ethos indiano, de forma nativa. Ele gera texto e código com um sentido inato das sensibilidades culturais e relevâncias indianas”, afirmou Aggarwal.
Atualmente, o modelo da Ola compreende 20 idiomas indianos e gera texto em 10, incluindo Hindi e inglês. Segundo a empresa, seu desempenho em idiomas indianos supera o do GPT-4, embora ainda fique atrás no desempenho em inglês — uma lacuna que se espera que diminua em breve.
A startup está avançando em fases, com planos para apoiar todos os idiomas indianos reconhecidos oficialmente e desenvolver uma versão Pro do modelo para resolução de problemas complexos, abrangendo texto, visão e fala. Além disso, a equipe de Aggarwal está desenvolvendo um chatbot semelhante ao ChatGPT, adaptado para usuários indianos, que ainda não está disponível publicamente, e realizando P&D para construir um supercomputador de IA.
Gigantes Competidores
Enquanto os modelos da Krutrim se preparam para aplicações no mundo real, a startup se destaca como uma das primeiras do índias a abordar o setor de IA generativa de forma abrangente. Outros concorrentes notáveis incluem a Tech Mahindra e a Reliance Industries.
Sob a liderança de Gurnani, a Tech Mahindra iniciou o Projeto Indus, um modelo de linguagem grande (LLM) de código aberto lançado para testes internos. Previsto para estrear em fevereiro de 2024, foca no Hindi com 539 milhões de parâmetros e 10 bilhões de tokens de Hindi e dialetos, embora não suporte todas as línguas inicialmente. “Na primeira fase, criaremos o LLM para Hindi e mais de 37 dialetos, e depois ampliaremos para outros idiomas”, explicou a empresa.
Enquanto isso, a Reliance Industries, que liderou a revolução 4G na Índia com a Jio, anunciou planos para desenvolver modelos de linguagem adaptados ao mercado indiano. A empresa fez uma parceria com a Nvidia para acessar o superchip GH200 e construir uma infraestrutura de IA que supere as capacidades do supercomputador mais rápido da Índia, colaborando com o Instituto Indiano de Tecnologia de Bombaim no projeto chamado Bharat GPT. Embora os detalhes sejam escassos, parece que a Reliance visa integrar essa oferta de GPT em seus serviços voltados para o consumidor, incluindo a Jio.
Junto com a Reliance e a Tech Mahindra, a Sarvam AI, com sede em Bengaluru, atraiu atenção com uma iniciativa recentemente financiada de 41 milhões de dólares. A Sarvam desenvolveu um modelo de linguagem indiana de 7 bilhões de parâmetros baseado no Llama2 e planeja lançar uma plataforma focada em empresas para construir aplicações de IA generativa.
A Corover, apoiada pelo Google, também fez avanços, afirmando ter construído um modelo de linguagem indiana que suporta 22 idiomas para chatbots empresariais conversacionais.
Aprimorando as Experiências em IA Generativa
À medida que o cenário de IA generativa evolui com novos participantes e avanços tecnológicos, espera-se o surgimento de sofisticados modelos de linguagem indiana, tanto fechados quanto de código aberto. Essa evolução melhorará fluxos de trabalho internos e promoverá aplicações inovadoras em diversos setores.
Por exemplo, a Tech Mahindra imagina o LLM do Projeto Indus como um assistente digital para mais de 140 milhões de agricultores, fornecendo informações vitais sobre empréstimos, pesticidas e agricultura em seus idiomas preferidos. Isso também poderia aprimorar serviços de saúde e finanças, interpretando dialetos locais rapidamente. As possíveis aplicações são vastas.
Será intrigante ver como esses modelos se compararão aos de líderes globais, incluindo a OpenAI, que está prestes a lançar o GPT-4.5, e a série Gemini recentemente apresentada pelo Google.