Indiens Initiativen für Generative KI: Aktuelle Entwicklungen und Zukunftsperspektiven

Als Sam Altman im letzten Jahr Indien besuchte, bemerkte er, dass ein Startup mit nur 10 Millionen USD nicht mit OpenAI im Training von Basis-Modellen konkurrieren könne. Diese Aussage löste eine bedeutende Diskussion aus, insbesondere als CP Gurnani, der ehemalige CEO von Tech Mahindra, entgegnete, dass die Herausforderung, generative KI in Indien zu entwickeln, angenommen wurde.

Schaut man auf Anfang 2024, hat Indien—ein Land, das für sein Talent im Technologiebereich bekannt ist—erheblich Fortschritte in der generativen KI gemacht. Interessanterweise ist das erste indische Startup, das sich mit den GPT-Modellen von OpenAI auseinandersetzt, nicht Tech Mahindra, sondern Ola's Bhavish Aggarwal, der zuvor die mit Uber konkurrierende Mitfahrplattform gegründet hat.

Ola Krutrim, was "künstlich" bedeutet, hat letzten Monat sein erstes Sprachmodell, Krutrim Base, und einen entsprechenden Chatbot gestartet, mit Plänen für eine baldige breitere Einführung. Auch andere Unternehmen, darunter Tech Mahindra und Reliance Industries, steigen in den Wettbewerb ein.

Lokalisierte Erlebnisse in der generativen KI

Während Modelle wie OpenAIs GPT und Metas Llama in der Text- und Code-Generierung glänzen, haben sie oft Schwierigkeiten mit nicht-englischen Sprachen, besonders solchen, die digital weniger vertreten sind. Um dies zu beheben, haben Technologieunternehmen in Ländern wie Südkorea, Finnland und China begonnen, proprietäre Modelle zu entwickeln, die die Repräsentation lokaler Sprachen und kultureller Kontexte in ihren Trainingsdaten verbessern.

Indien steht vor einer komplexen Herausforderung, mit 1,4 Milliarden Menschen, 22 Amtssprachen und Tausenden von Dialekten. Ein Modell zu schaffen, das diese sprachliche Vielfalt umfasst, ist sowohl anspruchsvoll als auch kapitalintensiv.

Aggarwal gründete Krutrim im April 2023 und sammelte 24 Millionen USD Fremdkapital von Matrix Partners. Das Modell des Startups ist auf zwei Billionen Tokens trainiert und bietet die größte Repräsentation indischer Sprachen – 20-mal mehr als jedes vorhandene Modell. „Krutrim hat eine indische Ethik, nativ. Es erzeugt Texte und Codes mit einem angeborenen Gespür für indische kulturelle Sensibilitäten und Relevanz“, erklärte Aggarwal.

Aktuell versteht Olas Modell 20 indische Sprachen und generiert Texte in 10, darunter Hindi und Englisch. Laut dem Unternehmen übertrifft seine Leistung in den indischen Sprachen die von GPT-4, während sie im Englischen hinterherhinkt – eine Lücke, die bald geschlossen werden soll.

Das Startup entwickelt sich in Phasen weiter, mit dem Ziel, alle offiziell anerkannten indischen Sprachen zu unterstützen und eine Pro-Version des Modells für komplexe Problemlösungen zu entwickeln, die Text, Bild und Sprache umfasst. Darüber hinaus arbeitet Aggarwals Team an einem ChatGPT-ähnlichen Chatbot, der speziell auf indische Benutzer zugeschnitten ist und noch nicht öffentlich verfügbar ist. Es wird auch an einem KI-Supercomputer geforscht.

Wettbewerb der Giganten

Während Krutrims Modelle sich auf reale Anwendungen vorbereiten, gilt es als eines der ersten indischen Startups, das die Landschaft der generativen KI umfassend angeht. Weitere bedeutende Mitbewerber sind Tech Mahindra und Reliance Industries.

Unter Gurnanis Führung hat Tech Mahindra das Indus-Projekt initiiert, ein quelloffenes großes Sprachmodell (LLM), das für interne Tests gestartet wurde. Die Einführung ist für Februar 2024 geplant und konzentriert sich auf Hindi mit 539 Millionen Parametern und 10 Milliarden Hindi- und Dialekt-Tokens, obwohl nicht alle Sprachen anfänglich unterstützt werden. „In der ersten Phase werden wir das LLM für Hindi und 37+ Dialekte erstellen und dann auf andere Sprachen erweitern“, erklärte das Unternehmen.

In der Zwischenzeit hat Reliance Industries, das die 4G-Revolution in Indien mit Jio anführte, Pläne bekannt gegeben, Sprachmodelle für den indischen Markt zu entwickeln. Das Unternehmen hat sich mit Nvidia zusammengetan, um auf den GH200-Superchip zuzugreifen und eine KI-Infrastruktur aufzubauen, die die Fähigkeiten des schnellsten indischen Supercomputers übertrifft, und arbeitet mit dem Indian Institute of Technology-Bombay am Projekt Bharat GPT zusammen. Obwohl die Einzelheiten spärlich sind, scheint Reliance zu beabsichtigen, dieses GPT-Angebot in seine verbraucherorientierten Dienste, einschließlich Jio, zu integrieren.

Neben Reliance und Tech Mahindra hat das in Bengaluru ansässige Sarvam AI mit einer kürzlich finanzierten Initiative in Höhe von 41 Millionen USD Aufmerksamkeit erregt. Sarvam hat ein 7 Milliarden Parameter großes Indik-Sprachmodell auf Basis von Llama2 entwickelt und plant, eine plattformübergreifende Lösung für Unternehmen zum Aufbau generativer KI-Anwendungen auf den Markt zu bringen.

Das von Google unterstützte Corover hat ebenfalls Fortschritte gemacht und behauptet, ein Indik-Sprachmodell entwickelt zu haben, das 22 Sprachen für konversationelle Unternehmens-Chatbots unterstützt.

Verbesserung der generativen KI-Erlebnisse

Mit der Weiterentwicklung der generativen KI-Landschaft durch neue Akteure und technologische Fortschritte wird die Emergenz anspruchsvoller geschlossener und offener Indik-Sprachmodelle erwartet. Diese Entwicklung wird interne Arbeitsabläufe verbessern und innovative Anwendungen in verschiedenen Sektoren fördern.

So sieht Tech Mahindra das LLM des Indus-Projekts als digitalen Assistenten für über 140 Millionen Landwirte vor, der wichtige Informationen zu Krediten, Pestiziden und Landwirtschaft in ihren bevorzugten Sprachen bereitstellt. Dies könnte auch die Gesundheits- und Finanzdienstleistungen verbessern, indem lokale Dialekte schnell interpretiert werden. Die möglichen Anwendungen sind enorm.

Es wird spannend zu beobachten sein, wie diese Modelle im Vergleich zu globalen Mitbewerbern, darunter Branchenführer wie OpenAI, das kurz vor der Einführung von GPT-4.5 steht, und die kürzlich vorgestellte Gemini-Serie von Google, abschneiden.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles