印度的生成式人工智慧倡議：新興發展與未來展望

Home AI新聞印度的生成式人工智慧倡議：新興發展與未來展望

去年，當塞姆·奧特曼訪問印度時，他提到一個資金僅有一千萬美元的初創公司無法與OpenAI在基礎模型的訓練上競爭。這一評論引發了廣泛討論，特別是當曾任Tech Mahindra首席執行官的CP Gurnani回應時表示，印度在開發生成式AI方面所面臨的挑戰是被接受的。

快進到2024年初，以科技人才著稱的印度在生成式AI領域取得了顯著進展。有趣的是，第一家挑戰OpenAI的GPT模型的印度初創公司並不是Tech Mahindra，而是Ola的巴維什·阿加瓦爾，他曾創立這家拼車公司以與Uber競爭。Ola Krutrim（意為「人工」）上個月推出了初始語言模型Krutrim base及相應聊天機器人，並計劃很快進行廣泛應用。其他競爭者，包括Tech Mahindra和Reliance Industries，也在加入這場競賽。

生成式AI中的本地化體驗

雖然像OpenAI的GPT和Meta的Llama等模型在生成文本和代碼方面表現優秀，但它們在非英語語言（特別是數字表現較少的語言）上往往面臨挑戰。為了解決這一問題，韓國、芬蘭和中國等國的科技公司開始開發專有模型，以增強他們訓練數據中本地語言和文化背景的表現。

印度面臨更複雜的挑戰，擁有14億人口以及22種官方語言，再加上數千種方言。創建一個能涵蓋這種語言多樣性的模型既艱巨又資本密集。阿加瓦爾於2023年4月創立Krutrim，並從Matrix Partners籌集2400萬美元的資金。該初創公司的模型在兩兆個標記上進行訓練，擁有最大規模的印度語言表現，是現有模型的20倍。“Krutrim本質上是印度精神。它在生成文本和代碼時，自然融合了印度文化的敏感性和相關性，”阿加瓦爾表示。

目前，Ola的模型理解20種印度語言，並能生成包括印地語和英語在內的10種語言文本。根據公司資料，其在印度語言中的表現超過GPT-4，雖然在英語表現上仍稍顯遜色，但預計不久將縮小這一差距。該初創公司目前正分階段推進，計劃支持所有官方認可的印度語言，並開發一款面向複雜問題解決的專業版本模型，包括文本、視覺和語音。此外，阿加瓦爾的團隊正在開發一款針對印度用戶的類ChatGPT聊天機器人，目前尚未公開，並進行研究開發以建設AI超級計算機。

競爭中的巨頭

隨著Krutrim的模型準備進入現實應用，它成為首批全面應對生成式AI領域的印度初創公司之一。其他重要競爭者包括Tech Mahindra和Reliance Industries。在Gurnani的領導下，Tech Mahindra啟動了印度計畫（The Indus Project），這是一個開源大型語言模型，將於2024年2月首次亮相，重點是印地語，擁有5.39億個參數和100億個印地語及方言標記，但最初不會支持所有語言。“在第一階段，我們將創建針對印地語及37種以上方言的大型語言模型，然後擴展到其他語言，”公司解釋道。

同時，以Jio引領印度4G革命的Reliance Industries宣布計劃開發為印度市場量身定制的語言模型。該公司已與Nvidia合作，利用GH200超級芯片建設超越印度最快超級電腦的AI基礎設施，並與印度理工學院孟買校區共同開展名為Bharat GPT的項目。雖然詳情不多，但Reliance似乎的確希望將這一GPT產品整合到其面向消費者的服務中，包括Jio。

在Reliance和Tech Mahindra的競爭中，位於班加羅爾的Sarvam AI也因為近期籌集的4100萬美元資金而受到關注。Sarvam已開發基於Llama2的70億參數印度語言模型，並計劃推出一個專注於企業的生成式AI應用平台。

Google支持的Corover也有所進展，聲稱已建立了一款支持22種語言的印度語言模型，用於會話型企業聊天機器人。

提升生成式AI體驗

隨著新競爭者和技術進步，生成式AI領域的閉源和開源印度語言模型預計將不斷湧現。這一演變將改善內部工作流程，並在各個行業內促進創新應用。

例如，Tech Mahindra展望印度計畫的LLM將成為超過1.4億農民的數字助手，提供有關貸款、農藥和農業的關鍵信息，並且以他們偏好的語言呈現。它還可能通過快速解讀當地方言，提升醫療和金融服務的效率，潛在的應用範圍廣闊。

有趣的是，這些模型如何與全球競爭者的表現相比，包括即將推出的GPT-4.5和Google最近公布的Gemini系列。

企業如何運用生成式人工智慧來防範 ChatGPT 數據洩露

新的人體研究揭示人工智慧系統中的隱藏「潛伏者」