Cognition a récemment retenu l'attention avec Devin, son ingénieur logiciel alimenté par IA, capable d'écrire et de modifier du code de manière autonome grâce à GPT-4 d'OpenAI. Cependant, seulement cinq mois après le lancement de Devin en mars 2024, un nouveau challenger a fait son apparition : Genie de Cosine.
Genie, un ingénieur IA autonome développé par Cosine, soutenu par Y Combinator, prétend surpasser Devin avec un score de 30 % sur le benchmark SWE-Bench, bien supérieur aux 13,8 % de Devin et aux 19 % des modèles Q d'Amazon et Code Droid de Factory. Le PDG de Cosine, Alistair Pullen, souligne que Genie dépasse les simples scores de benchmark. "Ce modèle a été spécifiquement entraîné pour penser et agir comme un ingénieur logiciel humain," a-t-il déclaré sur les réseaux sociaux.
Qu'est-ce que Genie et Que Peut-il Faire ?
Genie est conçu pour gérer autonomement une variété de tâches de codage, allant de la correction de bogues à la création de fonctionnalités et à la validation de code. Il peut fonctionner de manière indépendante ou collaborer avec des utilisateurs, imitant l'expérience de travailler aux côtés d'un collègue compétent. "Nous visons à créer un collègue artificiel capable de réaliser des tâches de programmation de bout en bout de manière fiable," a noté Pullen lors de l'annonce des capacités de Genie.
Genie prend en charge 15 langages de programmation, dont :
- JavaScript
- Python
- TypeScript
- Java
- C
- C++
- Rust
- Swift
- PHP
- Ruby
Pullen explique : "En observant comment les ingénieurs humains travaillent, Genie apprend à reproduire leurs processus." Le code généré est stocké dans les dépôts GitHub des utilisateurs, garantissant que Cosine ne conserve aucune information sensible.
Intégration et Collaboration
Genie s'intègre parfaitement à des plateformes comme Slack, lui permettant de communiquer avec les utilisateurs comme un collègue humain. Il peut poser des questions de clarification et répondre aux retours sur les demandes de tirage, améliorant ainsi la collaboration.
Alimenté par un Modèle Avancé d'OpenAI
Genie utilise une variante propriétaire du GPT-4o d'OpenAI, spécifiquement conçue pour des sorties de long contexte. Ce modèle peut générer jusqu'à 64 000 jetons, offrant des avantages significatifs par rapport aux versions précédentes, limitées à 4 000 jetons. Avec un vaste ensemble de données comprenant des milliards de combinaisons de jetons issues d'activités d'ingénierie réelles, Genie améliore continuellement ses performances. "Nos données d'entraînement incluent des PR, des commits et des problèmes recueillis dans des dépôts open-source," a commenté Pullen. Ce pipeline de données minutieux garantit des aperçus de haute qualité sur les approches de résolution de problèmes humaines.
Structure Tarifaire
Genie proposera initialement deux niveaux de tarification :
1. Plan Individuel : À un prix compétitif d'environ 20 $, cette option offre des capacités limitées mais démontre le potentiel de Genie pour des particuliers et des petites équipes.
2. Plan Entreprise : Cette offre complète inclut une utilisation illimitée et des fonctionnalités avancées conçues pour créer un collègue d'ingénierie IA exceptionnel.
Implications et Perspectives d'Avenir
Les capacités avancées de Genie pourraient révolutionner le développement logiciel en augmentant l'efficacité et en permettant aux équipes d'ingénierie de se concentrer sur des objectifs stratégiques. "La capacité d’une IA à gérer des bases de code complexes de manière autonome peut radicalement changer notre approche de l'allocation des ressources," a déclaré Pullen. Cosine vise à élargir les fonctionnalités de Genie, en développant des modèles plus petits pour des tâches basiques et des versions plus grandes pour des défis complexes. Des projets de collaboration avec des communautés open-source sont également envisagés.
Prochaines Étapes et Disponibilité
Bien que Genie soit actuellement proposé à des utilisateurs sélectionnés, les personnes intéressées peuvent postuler pour un accès anticipé via le site de Cosine. Cosine s'engage à une amélioration continue, intégrant les retours des utilisateurs pour enrichir les capacités de Genie. En outre, Cosine vise à maintenir certains aspects propriétaires de sa méthodologie tout en partageant de manière transparente les résultats de Genie sur GitHub pour une vérification indépendante.
À Propos de Cosine
Fondé en 2022 par Pullen, Sam Stenner et Yang Li, Cosine est dédié à l'application du raisonnement humain à des problèmes complexes en intelligence artificielle, en commençant par l'ingénierie logicielle. Avec 2,5 millions de dollars de financement initial, Cosine vise à redéfinir comment l'IA peut imiter et innover dans les tâches humaines. "Nous croyons pouvoir traduire le raisonnement humain pour n'importe quel secteur, en commençant par l'ingénierie logicielle," a affirmé Pullen. Le lancement de Genie n'est que le début du parcours ambitieux de Cosine.