インドの生成AIイニシアティブ:新たな進展と未来の展望

Sam Altmanが昨年、インドを訪れた際、「1,000万ドルの資金しかないスタートアップがOpenAIの基盤モデルのトレーニングで競争できない」と発言しました。このコメントは大きな議論を呼び起こし、特にテック・マヒンドラの元CEO、CP・グルナニが「インドでの生成AI開発の挑戦を受け入れた」と応じたことで注目を集めました。

2024年初頭、インドはその工学技術者が多く、生成AIにおいて顕著な進展を遂げています。興味深いことに、OpenAIのGPTモデルに挑む最初のインドのスタートアップはテック・マヒンドラではなく、Uberに競合するためにライドシェア会社を立ち上げたオラのバビシュ・アガルワールが率いるものです。

オラ・クルトリム(「人工」を意味する)は、先月、初の言語モデル「クルトリム・ベース」とそれに対応するチャットボットを発表しました。一般向けの普及も間近です。テック・マヒンドラやリライアンス・インダストリーズなど、他の競合企業もこの競争に参入しています。

地域に特化した生成AI体験

OpenAIのGPTやMeta社のラマのようなモデルはテキストやコード生成に優れる一方で、英語以外の言語、特にデジタルでの表現が少ない言語には課題を抱えています。この問題に対処するため、韓国、フィンランド、中国などの技術企業は、地域の言語と文化的コンテクストの表現を強化する独自のモデルの開発に着手しました。

インドは14億人が住み、22の公用語と数千の方言が存在するため、言語の多様性を取り入れたモデルの構築は困難であり、大きな資本が必要です。アガルワールは2023年4月にクルトリムを設立し、マトリックス・パートナーズから2,400万ドルの資金を調達しました。このスタートアップのモデルは、インドの言語表現において圧倒的な規模を誇る20倍のトークン数で、インディック言語を網羅しています。「クルトリムはインドのエートスを内包しており、インド文化の感性と関連性を生かしてテキストやコードを生成します」とアガルワールは述べています。

現在、オラのモデルは20のインドの言語を理解し、ヒンディー語や英語を含む10の言語でテキストを生成できます。企業によれば、インディック言語の性能はGPT-4を上回っていますが、英語に関しては性能が劣ります。しかし、このギャップはすぐに埋まると予想されています。

このスタートアップは、公式に認められたすべてのインディック言語をサポートし、テキスト、ビジョン、音声を含む複雑な問題解決のためのプロ版モデルを開発する計画を進めています。また、アガルワールのチームは、インドのユーザー向けにカスタマイズしたChatGPT類似のチャットボットを開発しており、現在は公開されていません。このほか、AIスーパーコンピューターの開発に向けた研究開発も行っています。

競争する巨人たち

クルトリムのモデルが実用化に向けて進む中、インドのスタートアップとして初めて生成AIの分野を包括的に取り組んでいます。テック・マヒンドラやリライアンス・インダストリーズといった他の重要な競争者もいます。

グルナニの指導の下、テック・マヒンドラは「インダス・プロジェクト」というオープンソースの大規模言語モデル(LLM)を内部テスト用に立ち上げました。2024年2月にデビューするこのプロジェクトは、5億3900万のパラメータと100億のヒンディー語および方言のトークンを備えていますが、初めはすべての言語をサポートしない見込みです。「初期段階では、ヒンディー語と37以上の方言のLLMを開発し、その後他の言語に拡張します」と企業は説明しています。

一方、リライアンス・インダストリーズは、ジョイオでインドの4G革命を推進した実績を持ち、インド市場向けの言語モデルを開発する計画を発表しました。インド工科大学ムンバイ校と協力し、AIインフラを構築してインド最速のスーパーコンピューターを上回るGH200スーパーチップにアクセスするプロジェクト「バラトGPT」を進めています。詳細は定かではありませんが、リライアンスはこのGPTを自社の消費者向けサービスに統合することを目指しているようです。

テック・マヒンドラやリライアンスに加えて、バンガロールを拠点とするサルヴァムAIは、4,100万ドルの資金調達を行い、注目を集めています。サルヴァムはLlama2に基づく70億パラメータのインディック言語モデルを開発し、生成AIアプリケーションを構築する企業向けプラットフォームを立ち上げる計画です。

Googleの支援を受けているコローバーも、22の言語をサポートしたインディック言語モデルを構築したと主張し、企業向けの会話型チャットボットに対応しています。

生成AI体験の向上

生成AIの分野は新たな競争者や技術の進展に伴い進化し、洗練されたオープンソースおよびクローズドソースのインディック言語モデルが登場することが期待されています。この進化は、内部のワークフローを改善し、さまざまな分野で革新的なアプリケーションを育むでしょう。

たとえば、テック・マヒンドラはインダスプロジェクトのLLMを1億4,000万人の農家のデジタルアシスタントとして位置づけ、彼らの好みの言語で融資、農薬、農業に関する重要な情報を提供することを想定しています。さらに、地域の方言を迅速に解釈することで、医療や金融サービスの向上も見込まれています。潜在的な応用は非常に広範囲です。

これらのモデルが、OpenAIのGPT-4.5やGoogleの新たに発表されたGeminiSiriーズなどの世界的な競争相手とどのように対抗していくのか、大変興味深いところです。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles