Sakana AI utilise un algorithme évolutif pour révéler des architectures innovantes pour les modèles génératifs.

Home Actualités IA Sakana AI utilise un algorithme évolutif pour révéler des architectures innovantes pour les modèles génératifs.

Une technique révolutionnaire développée par la startup tokyoïte Sakana AI, connue sous le nom de Fusion de Modèles Évolutionnaires, automatise la création de modèles génératifs. S'inspirant de la sélection naturelle, cette approche combine des éléments de modèles existants pour produire des itérations plus avancées.

Sakana AI, cofondée en août 2023 par des chercheurs en intelligence artificielle de renom tels que les anciens experts de Google David Ha et Llion Jones—co-auteur du célèbre article "Attention Is All You Need"—se positionne à l'avant-garde de l'innovation en IA générative.

Révolution de Développement de Modèles

La Fusion de Modèles Évolutionnaires de Sakana permet aux développeurs et aux organisations de créer et d'explorer de nouveaux modèles de manière économique, éliminant ainsi le besoin d'un entraînement coûteux et d'un ajustement fin de modèles propriétaires. La startup a récemment introduit des grands modèles de langage (LLMs) et des modèles vision-langage (VLMs) développés grâce à cette technique novatrice.

Comprendre la Fusion de Modèles

L'entraînement de modèles génératifs est souvent onéreux et complexe. Cependant, avec l'émergence de modèles ouverts tels que Llama 2 et Mistral, les développeurs exploitent la fusion de modèles—combinant divers composants de deux modèles pré-entraînés ou plus pour former un nouveau modèle. Cette méthode permet au modèle fusionné d'hériter des forces de ses prédécesseurs sans nécessiter d'entraînement supplémentaire, en faisant une option économiquement avantageuse. De nombreux modèles de premier plan sur les classements Open LLM sont désormais des variantes fusionnées de modèles fondamentaux populaires.

Les chercheurs de Sakana AI notent : « Une communauté dynamique de chercheurs, de hackers et d'artistes développe activement de nouveaux modèles fondamentaux en affinant et en fusionnant des modèles existants. » Avec plus de 500 000 modèles disponibles sur Hugging Face, la fusion de modèles offre d'énormes opportunités pour créer des solutions innovantes à des coûts minimaux, bien qu'elle nécessite une intuition et des connaissances de domaine significatives.

Présentation de la Fusion de Modèles Évolutionnaires

Sakana AI cherche à optimiser le processus de fusion de modèles grâce à une approche systématique. S'inspirant des algorithmes évolutionnaires—des techniques d'optimisation imitant la sélection naturelle—la Fusion de Modèles Évolutionnaires identifie les moyens les plus efficaces de combiner différents modèles.

David Ha souligne : « La capacité d'évoluer de nouveaux modèles à partir de modèles existants variés a des implications cruciales. » Face à l'augmentation des demandes en ressources pour l'entraînement de modèles fondamentaux, cette approche évolutionnaire pourrait s'avérer bénéfique pour des institutions ou des gouvernements cherchant à développer rapidement des modèles prototypes sans investissement substantiel.

La Fusion de Modèles Évolutionnaires fonctionne automatiquement, évaluant les couches et les poids des modèles existants pour créer de nouvelles architectures adaptées aux besoins des utilisateurs.

Démonstration de la Fusion Évolutionnaire

Pour explorer le potentiel de cette approche, les chercheurs de Sakana AI ont appliqué la Fusion de Modèles Évolutionnaires pour créer un LLM japonais capable de raisonnement mathématique et un VLM japonais. Les modèles résultants ont surpassé plusieurs référentiels sans optimisation explicite. Par exemple, leur EvoLLM-JP, un LLM japonais de 7 milliards de paramètres, a excellé même contre des concurrents de 70 milliards de paramètres.

Pour le VLM japonais, l'équipe a fusionné LLaVa-1.6-Mistral-7B avec Shisa-Gamma 7B, donnant naissance à EvoVLM-JP, qui a dépassé à la fois LLaVa-1.6-Mistral-7B et le JSVLM préexistant. Les deux modèles sont disponibles sur Hugging Face et GitHub.

Sakana AI adapte également ses méthodes de fusion évolutionnaire pour les modèles de génération d'images par diffusion, visant à améliorer les performances de Stable Diffusion XL pour des requêtes en japonais.

La Vision de Sakana AI

Fondée par David Ha et Llion Jones, Sakana AI cherche à exploiter des concepts inspirés de la nature, tels que l'évolution et l'intelligence collective, pour créer des modèles fondamentaux d'IA. L'équipe est convaincue que l'avenir de l'IA ne tournera pas autour d'un système unique et omniprésent, mais plutôt autour d'un réseau de systèmes d'IA spécialisés adaptés à des niches distinctes, collaborant et évoluant pour répondre à divers besoins.

Standard AI passe à l'analyse de vision par ordinateur pour les détaillants, atteignant une valorisation de 1,5 milliard de dollars.

Découvrez comment les fonctionnalités alimentées par l'IA dans Cisco Webex peuvent identifier le burnout chez les employés des centres de contact.

Most people like

SaaSykit

29.4K

Dans le paysage numérique rapide d'aujourd'hui, accélérer le développement de logiciels en tant que service (SaaS) est essentiel pour les entreprises souhaitant rester compétitives. Avec les bonnes stratégies et outils, les organisations peuvent rationaliser leurs processus de développement, améliorer la collaboration et offrir des solutions logicielles innovantes plus rapidement. Ce guide explore des techniques efficaces pour accélérer le développement SaaS, vous assurant de répondre aux demandes croissantes des clients et d'atteindre vos objectifs commerciaux plus rapidement que jamais. Découvrez comment optimiser votre cycle de développement et favoriser la croissance dans l'industrie SaaS.

Kit de démarrage SaaS AI Website Designer

200+ ChatGPT Mega-Prompts for Business

78.9K

Déverrouillez la puissance de l'IA avec notre collection ultime de méga-invites ChatGPT conçues pour améliorer, optimiser et développer votre entreprise de manière efficace. Adoptez des stratégies innovantes qui favoriseront la croissance et l'efficacité dans le paysage concurrentiel d'aujourd'hui.

Génération de leads Writing Assistants

Data-Driven Shopify Insights

15.5K

Découvrez des stratégies essentielles pour améliorer votre entreprise Shopify et débloquer des insights précieux qui favorisent la croissance.

Analytics Shopify AI Analytics Assistant

Help.center

45.5K

Help.Center est une plateforme de support client alimentée par l'IA qui propose des fonctionnalités de chat interactives et une base de connaissances complète, conçues pour améliorer l'expérience utilisateur et simplifier l'assistance.

Support client par IA Large Language Models (LLMs)

Find AI tools in YBX