Mark Zuckerberg investit massivement dans l'intelligence artificielle (IA) dans le cadre d'une mission plus large visant à lutter contre les maladies. À travers l'Initiative Chan Zuckerberg (CZI), qu'il co-dirige avec sa femme, Priscilla Chan, l'organisation s'engage à établir l'un des plus grands systèmes informatiques au monde dédié à la recherche scientifique à but non lucratif. Ce cluster de calcul haute performance devrait accueillir plus de 1 000 unités de traitement graphique (GPU) spécialisées pour l'IA et les grands modèles de langage (LLM). En exploitant cette puissance de calcul, les scientifiques auront accès à des modèles prédictifs qui analyseront à la fois les cellules saines et malades, ouvrant la voie à des avancées médicales révolutionnaires.
Patricia Brennan, vice-présidente de la technologie scientifique à CZI, souligne l'importance de cette initiative : « Construire ce système informatique d’IA est une étape cruciale vers la guérison, la prévention ou la gestion de toutes les maladies d'ici la fin du siècle. Cela approfondira la compréhension des cellules et de leurs interactions au sein des systèmes biologiques. »
L'initiative prévoit d'utiliser cette puissance de calcul massive pour créer un simulateur de biologie virtuelle, permettant aux chercheurs de mieux comprendre comment les cellules contribuent au fonctionnement des organes dans le corps humain. Un des objectifs principaux est de construire une « cellule virtuelle », permettant aux scientifiques de cartographier divers états cellulaires, tant en santé qu'en maladie.
De nombreuses universités et institutions de recherche peinent à financer l'infrastructure nécessaire pour analyser de grands volumes de données biomédicales. Comme le note Brennan, « Le cluster d’IA sera l'un des systèmes de calcul haute performance les plus puissants au monde pour la recherche scientifique à but non lucratif. Alors que le secteur privé investit massivement dans des projets biomédicaux liés à l'IA, l'infrastructure robuste nécessaire pour développer des modèles numériques de cellules est économiquement inabordable pour beaucoup. »
La qualité des données est primordiale pour la modélisation réussie de l'IA ; l'initiative prévoit d'intégrer de grands ensembles de données dans ces modèles, en s'appuyant sur des ressources comme l'outil CZ CELLxGENE, qui contient plus de 50 millions d'enregistrements cellulaires. D'autres sources de données comprennent l'atlas des localisations et interactions des protéines, OpenCell, et l'atlas cellulaire, Tabula Sapiens.
David M. Truong, professeur adjoint en ingénierie biomédicale à l'Université de New York Tandon School of Engineering, souligne l'importance des ensembles de données de haute qualité : « Les précédents efforts ont rencontré des difficultés avec la qualité des données saisies. Bien que les grands ensembles de données biologiques modernes soient assez fiables, de nombreux chercheurs biomédicaux les trouvent difficiles à explorer. Les systèmes d’IA pourraient résumer et organiser efficacement les données pour les chercheurs. »
L'initiative de Zuckerberg dans le domaine de l'IA biomédicale s'inscrit dans une tendance plus large. Des systèmes innovants comme AlphaFold, une base de données révolutionnaire sur la structure des protéines, et l'atlas des protéines d'ESM avancent déjà notre compréhension de la biologie humaine. De plus, des plateformes comme Terra fournissent un accès basé sur le cloud pour les chercheurs biomédicaux, facilitant l'analyse des données et la collaboration sur des projets substantiels. Développée en partenariat entre le Broad Institute du MIT et de Harvard, Alphabet et Microsoft, Terra offre une plateforme avancée en tant que service (PaaS) simplifiant la gestion des ressources pour les utilisateurs.
Les contributions de Nvidia incluent Parabricks, qui exploite les GPU pour accélérer le séquençage génomique, réduisant ainsi de manière spectaculaire le temps de traitement et les coûts. De plus, le cadre BioNeMo de Nvidia fournit des LLMs prêts à l'emploi adaptés aux protéines et à la chimie, simplifiant les processus d'entraînement et de mise à l'échelle.
La vision derrière le projet d’IA de Zuckerberg est ambitieuse. Chan, ancienne pédiatre, a exprimé l'objectif de guérir, de prévenir ou de gérer toutes les maladies d'ici la fin du siècle. Brennan précise cette mission, affirmant que l'initiative cherche à aider les chercheurs à suivre les changements cellulaires tout au long de la vie, qu'ils soient héréditaires ou acquis.
Brennan ajoute : « À travers notre travail, nous cherchons des opportunités pour avoir un impact différencié, en reconnaissant la nécessité de données, d'infrastructures, de modèles, d'interfaces et de connaissances biologiques approfondies pour construire des modèles complets des cellules et systèmes humains. »
Eduardo Abeliuk, PDG de l'entreprise biotechnologique Teselagen, reconnaît l'ampleur de l'effort, déclarant : « Cette initiative représente un effort d'une ampleur sans précédent, visant à dépasser les projets d'infrastructure passés en termes d'accès à des capacités de calcul puissantes. » Cependant, il souligne également que l'atteinte de ces objectifs ambitieux nécessitera plus que des avancées technologiques. « Un progrès significatif dépendra d'une collaboration mondiale, d'efforts sociaux et d'avancées considérables en science fondamentale. »