印度的生成式人工智慧倡議:新興發展與未來展望

去年,當塞姆·奧特曼訪問印度時,他提到一個資金僅有一千萬美元的初創公司無法與OpenAI在基礎模型的訓練上競爭。這一評論引發了廣泛討論,特別是當曾任Tech Mahindra首席執行官的CP Gurnani回應時表示,印度在開發生成式AI方面所面臨的挑戰是被接受的。

快進到2024年初,以科技人才著稱的印度在生成式AI領域取得了顯著進展。有趣的是,第一家挑戰OpenAI的GPT模型的印度初創公司並不是Tech Mahindra,而是Ola的巴維什·阿加瓦爾,他曾創立這家拼車公司以與Uber競爭。Ola Krutrim(意為「人工」)上個月推出了初始語言模型Krutrim base及相應聊天機器人,並計劃很快進行廣泛應用。其他競爭者,包括Tech Mahindra和Reliance Industries,也在加入這場競賽。

生成式AI中的本地化體驗

雖然像OpenAI的GPT和Meta的Llama等模型在生成文本和代碼方面表現優秀,但它們在非英語語言(特別是數字表現較少的語言)上往往面臨挑戰。為了解決這一問題,韓國、芬蘭和中國等國的科技公司開始開發專有模型,以增強他們訓練數據中本地語言和文化背景的表現。

印度面臨更複雜的挑戰,擁有14億人口以及22種官方語言,再加上數千種方言。創建一個能涵蓋這種語言多樣性的模型既艱巨又資本密集。阿加瓦爾於2023年4月創立Krutrim,並從Matrix Partners籌集2400萬美元的資金。該初創公司的模型在兩兆個標記上進行訓練,擁有最大規模的印度語言表現,是現有模型的20倍。“Krutrim本質上是印度精神。它在生成文本和代碼時,自然融合了印度文化的敏感性和相關性,”阿加瓦爾表示。

目前,Ola的模型理解20種印度語言,並能生成包括印地語和英語在內的10種語言文本。根據公司資料,其在印度語言中的表現超過GPT-4,雖然在英語表現上仍稍顯遜色,但預計不久將縮小這一差距。該初創公司目前正分階段推進,計劃支持所有官方認可的印度語言,並開發一款面向複雜問題解決的專業版本模型,包括文本、視覺和語音。此外,阿加瓦爾的團隊正在開發一款針對印度用戶的類ChatGPT聊天機器人,目前尚未公開,並進行研究開發以建設AI超級計算機。

競爭中的巨頭

隨著Krutrim的模型準備進入現實應用,它成為首批全面應對生成式AI領域的印度初創公司之一。其他重要競爭者包括Tech Mahindra和Reliance Industries。在Gurnani的領導下,Tech Mahindra啟動了印度計畫(The Indus Project),這是一個開源大型語言模型,將於2024年2月首次亮相,重點是印地語,擁有5.39億個參數和100億個印地語及方言標記,但最初不會支持所有語言。“在第一階段,我們將創建針對印地語及37種以上方言的大型語言模型,然後擴展到其他語言,”公司解釋道。

同時,以Jio引領印度4G革命的Reliance Industries宣布計劃開發為印度市場量身定制的語言模型。該公司已與Nvidia合作,利用GH200超級芯片建設超越印度最快超級電腦的AI基礎設施,並與印度理工學院孟買校區共同開展名為Bharat GPT的項目。雖然詳情不多,但Reliance似乎的確希望將這一GPT產品整合到其面向消費者的服務中,包括Jio。

在Reliance和Tech Mahindra的競爭中,位於班加羅爾的Sarvam AI也因為近期籌集的4100萬美元資金而受到關注。Sarvam已開發基於Llama2的70億參數印度語言模型,並計劃推出一個專注於企業的生成式AI應用平台。

Google支持的Corover也有所進展,聲稱已建立了一款支持22種語言的印度語言模型,用於會話型企業聊天機器人。

提升生成式AI體驗

隨著新競爭者和技術進步,生成式AI領域的閉源和開源印度語言模型預計將不斷湧現。這一演變將改善內部工作流程,並在各個行業內促進創新應用。

例如,Tech Mahindra展望印度計畫的LLM將成為超過1.4億農民的數字助手,提供有關貸款、農藥和農業的關鍵信息,並且以他們偏好的語言呈現。它還可能通過快速解讀當地方言,提升醫療和金融服務的效率,潛在的應用範圍廣闊。

有趣的是,這些模型如何與全球競爭者的表現相比,包括即將推出的GPT-4.5和Google最近公布的Gemini系列。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles