Aujourd'hui, Cognition, une startup d'IA soutenue par le Founders Fund de Peter Thiel et des leaders technologiques tels que l'ancien dirigeant de Twitter Elad Gil et le co-fondateur de DoorDash Tony Xu, a lancé “Devin”, un ingénieur logiciel autonome entièrement intégré.
Contrairement aux assistants de codage existants comme GitHub Copilot, Devin se démarque en gérant des projets de développement dans leur intégralité, y compris le codage, le débogage et l'exécution de projets, tout en démontrant ses capacités sur des plateformes comme Upwork. Le lancement de Devin marque une évolution majeure dans le développement logiciel assisté par IA, offrant aux ingénieurs un véritable collaborateur IA plutôt qu'un simple outil pour rédiger des extraits de code.
Pour l'instant, Devin n'est pas disponible au public. Un accès limité a été accordé à un groupe select d'utilisateurs, dont la journaliste de Bloomberg Ashlee Vance, qui a partagé ses impressions sur le logiciel.
Qu'est-ce que Devin peut faire ?
Scott Wu, CEO de Cognition, a détaillé les capacités de Devin dans un article de blog, mettant en avant son accès à des outils essentiels pour développeurs, tels qu'un éditeur de code et un navigateur, dans un environnement sécurisé. Devin peut s'attaquer à des tâches d'ingénierie complexes qui nécessitent généralement des milliers de décisions.
Les utilisateurs saisissent simplement des instructions en langage naturel dans l'interface chatbot de Devin, qui élabore ensuite un plan étape par étape pour réaliser la tâche. Devin écrit de manière autonome le code, résout les problèmes, effectue des tests et fournit des mises à jour de progression en temps réel, permettant aux utilisateurs de suivre le projet sans difficulté.
En cas de divergences, les utilisateurs peuvent interagir directement via l'interface de chat pour donner des instructions, permettant ainsi aux équipes d'ingénierie de déléguer des tâches routinières et de se concentrer sur des travaux créatifs de haut niveau.
Devin incarne un avenir transformateur pour le développement logiciel, où les travailleurs IA opèrent sous la supervision humaine.
Polyvalence dans la gestion des tâches de développement
Selon les démonstrations de Wu, Devin excelle dans diverses tâches, y compris le déploiement d'applications et de sites Web, l'identification et la résolution de bugs, ainsi que des projets avancés comme le réglage de grands modèles de langage liés à des dépôts de recherche sur GitHub.
Dans un exemple, Devin a appris d'un article de blog à produire des images avec des messages cachés, tandis que dans un autre, il a géré avec succès un projet sur Upwork impliquant le développement d'un modèle de vision par ordinateur.
Lors du test SWE-bench—une évaluation utilisant de véritables problèmes open-source de GitHub—Devin a résolu 13,86 % des défis de manière autonome. En comparaison, Claude 2 a résolu 4,80 %, tandis que SWE-Llama-13b et GPT-4 ont résolu respectivement 3,97 % et 1,74 %, tous nécessitant une intervention humaine.
Technologie centrale non divulguée
La présence de l'IA dans le développement logiciel n'est pas nouvelle ; des outils comme GitHub Copilot, StarCoder et Codeium sont déjà disponibles. Cependant, la plupart se concentrent sur l'augmentation du codage plutôt que sur la gestion autonome de projets complets. Devin de Cognition représente un pas significatif en avant en tant qu'ingénieur IA totalement autonome.
Bien qu'il soit encore en phase de test, la capacité de Devin à gérer de manière autonome des projets d'ingénierie complexes le distingue. Cognition n'a pas précisé si elle utilise un modèle propriétaire ou une solution tiers, mais souligne les avancées en matière de raisonnement à long terme et de planification comme clés de sa fonctionnalité.
L'entreprise est actuellement en train d'élargir ses capacités et d'accorder un accès anticipé à des utilisateurs sélectionnés. Les parties intéressées souhaitant améliorer leurs capacités d'ingénierie peuvent contacter Cognition par email, avec une accessibilité plus large prévue dans le futur.
Cognition laisse entendre que le codage n'est "que le début", suggérant des projets de développement d'agents IA similaires dans d'autres domaines. Jusqu'à présent, la société a sécurisé 21 millions de dollars de financement.