Alors que l'écosystème des startups françaises prospère avec des entreprises comme Mistral, Poolside et Adaptive, Bioptimus, basée à Paris, a émergé de la clandestinité en annonçant une levée de fonds de 35 millions de dollars. Son objectif est de créer le premier modèle de fondation IA universel pour la biologie, intégrant l'IA générative à différentes échelles biologiques, des molécules aux cellules, tissus et organismes entiers.
Bioptimus est soutenue par une équipe d'anciens de Google DeepMind et de scientifiques d'Owkin, une startup biotech AI de premier plan et licorne française. Cette collaboration exploitera les ressources de calcul AWS et les capacités de génération de données d'Owkin, qui incluent l'accès à des données multimodales de patients provenant de grands hôpitaux académiques mondiaux. Comme mentionné dans un communiqué de presse, "Cela permet la création de représentations computationnelles qui nous différencient des modèles reposant uniquement sur des ensembles de données publiques et des modalités de données uniques, qui échouent à capturer toute la diversité biologique."
Dans une interview, Jean-Philippe Vert, cofondateur et PDG de Bioptimus ainsi que directeur R&D d'Owkin, a souligné qu'être une entreprise agile et indépendante permet à Bioptimus d'accéder aux données critiques plus rapidement que Google DeepMind. "Nous pouvons collaborer en toute sécurité avec des partenaires, établissant une confiance en partageant notre expertise en IA et en fournissant des modèles pour la recherche," a-t-il noté. "Une telle collaboration peut être difficile pour les grandes entreprises technologiques. Bioptimus mettra également en œuvre certains des contrôles de souveraineté les plus robustes disponibles aujourd'hui."
Rodolphe Jenatton, ancien chercheur chez Google DeepMind, a rejoint l'équipe de Bioptimus, mettant en avant l'engagement envers des modèles open-source et open-science, comme les publications de Mistral. "La transparence, le partage et la communauté sont fondamentaux pour notre mission," a-t-il déclaré.
Actuellement, de nombreux modèles d'IA se concentrent sur des aspects isolés de la biologie. Vert a expliqué : "Par exemple, certaines entreprises développent des modèles linguistiques pour les séquences de protéines, tandis que d'autres se concentrent sur des modèles de fondation pour l'imagerie cellulaire." Cependant, une vision complète de la biologie demeure insaisissable. "La bonne nouvelle est que la technologie IA progresse rapidement, certaines architectures permettant à toutes les données de contribuer à un modèle unifié," a-t-il ajouté. "C'est notre objectif : créer un modèle holistique qui n'existe pas encore, mais qui, je le crois, sera réalisé bientôt."
Le défi majeur, selon Vert, est l'accès aux données. "Former un grand modèle de langage sur des textes du web est très différent de ce que nous visons. Heureusement, notre partenariat avec Owkin nous offre un accès sans précédent aux données."