Apple lance OpenELM : un modèle de langage open-source pour améliorer le développement de l'IA sur les appareils.

Dans une avancée majeure dans le domaine de l'intelligence artificielle, Apple a récemment lancé OpenELM, une série de modèles de langage large en open source (LLMs) conçus pour fonctionner directement sur les appareils sans dépendre des serveurs cloud. Cette innovation renforce non seulement le leadership d’Apple en IA, mais entraîne également des changements révolutionnaires dans la recherche et les applications de traitement du langage naturel.

Le lancement d'OpenELM enrichit les ressources en IA disponibles sur la plateforme Hugging Face, offrant un espace collaboratif et innovant pour les chercheurs et développeurs du monde entier. La série comprend huit versions de modèles : quatre pré-entraînés avec la bibliothèque CoreNet et quatre affinés pour des scénarios d'application spécifiques.

Apple a adopté une stratégie de mise à l'échelle par couches dans le développement d'OpenELM, distribuant efficacement les paramètres dans chaque couche du modèle transformateur, ce qui a entraîné une augmentation notoire de l'exactitude. Avec un budget d'environ un milliard de paramètres, OpenELM améliore l'exactitude du modèle OLMo de 2,36 % tout en réduisant de moitié la quantité de données nécessaires pour le pré-entraînement.

Il est important de noter qu'avec le lancement d'OpenELM, Apple a également rendu le code source du modèle, les poids pré-entraînés, les journaux de formation complets, plusieurs points de contrôle et la configuration de pré-entraînement accessibles. Cette approche ouverte facilite la reproduction et l'optimisation du modèle par des chercheurs et des développeurs, accélérant ainsi les avancées dans le domaine du traitement du langage naturel.

Apple a déclaré que l'objectif du lancement d'OpenELM est d'« autonomiser et enrichir la communauté de recherche ouverte » avec des modèles linguistiques de pointe, offrant aux chercheurs des moyens d'explorer les risques, les données et les biais des modèles. Les développeurs et les entreprises peuvent utiliser ou modifier directement les modèles pour répondre à diverses applications pratiques.

De plus, cette initiative open-source positionne Apple pour attirer des ingénieurs, scientifiques et experts de premier plan. Sa politique de partage d’informations transparente offre aux chercheurs l'opportunité de publier des articles, un privilège souvent restreint par les pratiques secrètes précédentes d'Apple.

Bien qu'Apple n'ait pas encore complètement intégré ses capacités IA dans les appareils, des attentes généralisées suggèrent qu'iOS 18 comportera de nombreuses nouvelles fonctionnalités d'IA. Des rumeurs indiquent qu'Apple prévoit de faire fonctionner ses modèles de langage large directement sur les appareils pour améliorer la confidentialité des utilisateurs, offrant ainsi une expérience plus fluide et plus sécurisée.

Le lancement d'OpenELM établit sans aucun doute une base solide pour le développement d’Apple dans le domaine de l'intelligence artificielle. À mesure que d'autres entreprises et institutions de recherche s'engagent dans ce projet open-source, le domaine du traitement du langage naturel est prêt à connaître de nouvelles innovations et percées. En embrassant les initiatives open-source, Apple démontre son engagement à faire avancer la technologie et à promouvoir l'innovation collaborative.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles