L'auteur de Meta Galactica s'exprime sur le défi du lancement du modèle.

Home Actualités IA L'auteur de Meta Galactica s'exprime sur le défi du lancement du modèle.

Updated on octobre 25 2024

Il y a un an, juste avant le lancement de ChatGPT par OpenAI, Meta a présenté son propre modèle de langage de grande taille : Galactica. Ce modèle a suscité de vives controverses et a été retiré seulement quelques jours après son lancement. Aujourd'hui, l'un des auteurs originaux partage des réflexions sur le parcours tumultueux de ce projet.

Ross Taylor, co-fondateur de la plateforme Papers with Code, qui archive les recherches en apprentissage automatique, a joué un rôle clé dans le développement de Galactica, un modèle formé sur la littérature scientifique. Malheureusement, la démonstration du modèle a rencontré de graves problèmes, générant des citations pour des articles inexistants.

Dans un post franc sur X (anciennement Twitter), Taylor a évoqué les défis de l'équipe, admettant : « Nous étions débordés et avons perdu notre sens de la situation au lancement en publiant [une] démo » sans vérifications de qualité suffisantes. Il a reconnu qu'en dépit des critiques anticipées, l'intensité de leur charge de travail a flouté leur concentration.

Malgré ses performances solides par rapport à des modèles comme PaLM de Google et Chinchilla de DeepMind, la démo a éclipsé les capacités de Galactica. Taylor a précisé que l'objectif de la démo était d'évaluer les questions scientifiques posées aux grands modèles de langage, mais il a noté : « Nous aurions dû mieux réfléchir », réalisant que les journalistes testaient souvent le modèle au-delà de son objectif initial.

Il a également attribué une partie des réactions négatives à la perception des utilisateurs, affirmant que beaucoup considéraient Galactica comme un produit final, alors qu'il ne s'agissait que d'une démo d'un modèle de base. « Nous avons exposé notre vision sur le site, ce qui a induit des attentes trompeuses », a-t-il déclaré. Il a exprimé que, bien que la controverse aurait pu être atténuée, les craintes concernant la génération de « fausse science » par Galactica étaient exagérées.

À l'époque, des figures éminentes comme Michael Black, de l'Institut Max Planck, ont exprimé leurs inquiétudes, suggérant que Galactica pourrait alimenter une vague de falsifications scientifiques profondes. Grady Booch, un développeur clé du Unified Modeling Language, a qualifié le modèle de « peu plus qu'un non-sens statistique à grande échelle ». En réponse, Taylor a qualifié une grande partie des critiques de « vraiment idiotes », affirmant que le projet aurait pu être lancé avec plus de succès avec une planification soignée.

En repensant au projet, Taylor a soutenu la recherche et même la décision de publier une démo, la considérant comme un acte d'ouverture de la part d'un acteur majeur du secteur. « Cette ouverture sans précédent était malavisée compte tenu des vulnérabilités qu'elle exposait », a-t-il reconnu. L'engagement de Meta envers une approche open-source a depuis conduit au développement de LLaMA et de son homologue plus avancé, Llama 2, avec des enseignements de Galactica ayant informé ces modèles ultérieurs.

En conclusion, Taylor a exprimé sa volonté de reprendre le même projet, déclarant : « Mieux vaut faire quelque chose et le regretter que de ne rien faire du tout. » Il a souligné que, bien que l'expérience reste douloureuse, les leçons tirées ont été inestimables.

Résumé des nouvelles sur l'IA : Le budget d'automne du Royaume-Uni consacre 620 millions de dollars au développement de l'informatique IA

Découvrez Dream par LangChain : un outil d'IA sans code pour le développement simplifié d'applications web.

Most people like

Gunbot

35.9K

Découvrez un bot de trading crypto intuitif, conçu pour une utilisation fluide sur plusieurs échanges. Cette solution conviviale permet aux traders, quel que soit leur niveau d'expérience, d'optimiser leurs stratégies et d'améliorer leurs performances sur le marché sans effort. Rejoignez la communauté croissante de traders qui exploitent cet outil puissant pour naviguer dans le paysage crypto en toute confiance.

Bot de trading crypto AI Trading Bot Assistant

Towards AI Jobs

27.4K

Découvrez la plateforme de recherche d'emploi ultime conçue exclusivement pour les professionnels de l'apprentissage automatique. Connectez-vous avec des entreprises de premier plan et explorez des opportunités d'emploi sur mesure dans le domaine en constante évolution de l'apprentissage automatique. Commencez dès aujourd'hui votre parcours vers l'emploi de vos rêves !

apprentissage automatique AI Recruiting

Rizzle Text to Video AI

50.7K

Transformez rapidement des textes, des blogs et des tweets en vidéos captivantes grâce à la technologie IA de pointe de Rizzle. Créez du contenu engageant sans effort !

création de vidéos AI Video Generator

SEO VENDOR

47K

Les agences ont l'opportunité de rebranding et de revendre des services de SEO, de PPC et de design web sous leur propre nom, leur permettant ainsi d'élargir leur gamme de services et d'améliorer leur présence sur le marché.

SEO en marque blanche AI Advertising Assistant

Find AI tools in YBX