Heute hat Cognition, ein KI-Startup, das von Peter Thiels Founders Fund sowie von Tech-Größen wie dem ehemaligen Twitter-Manager Elad Gil und DoorDash-Mitbegründer Tony Xu unterstützt wird, "Devin" vorgestellt, einen vollständig autonomen KI-Software-Ingenieur.
Im Gegensatz zu bestehenden Codierungsassistenten wie GitHub Copilot hebt sich Devin dadurch hervor, dass er komplette Entwicklungsprojekte von Anfang bis Ende verwalten kann. Dies umfasst das Programmieren, Debuggen und Ausführen von Projekten, wobei seine Fähigkeiten auf Plattformen wie Upwork demonstriert werden.
Die Einführung von Devin markiert eine entscheidende Weiterentwicklung in der KI-gestützten Softwareentwicklung, die Ingenieuren einen umfassenden KI-Mitarbeiter statt eines bloßen Werkzeugs zum Schreiben einfacher Code-Snippets bietet.
Derzeit ist Devin nicht öffentlich verfügbar. Einem ausgewählten Nutzerkreis, darunter die Bloomberg-Journalistin Ashlee Vance, wurde begrenzter Zugang gewährt, die Einblicke in die Nutzung der Software teilte.
Was kann Devin tun?
Cognition-CEO Scott Wu erläuterte in einem Blogbeitrag die Fähigkeiten von Devin und hob hervor, dass dieser auf wichtige Entwickler-Tools wie einen Code-Editor und Browser in einer sicheren, isolierten Umgebung zugreifen kann. Devin kann komplexe Ingenieuraufgaben übernehmen, die typischerweise Tausende von Entscheidungen erfordern.
Die Nutzer geben einfach natürliche Spracheingaben in Devins Chatbot-Oberfläche ein, die dann einen schrittweisen Plan zur Bewältigung der Aufgabe erstellt. Devin schreibt autonom Code, löst Probleme, führt Tests durch und liefert Echtzeit-Updates, die es den Nutzern ermöglichen, den Projektfortschritt nahtlos zu verfolgen.
Wenn Nutzer Unstimmigkeiten feststellen, können sie direkt über die Chat-Oberfläche Befehle erteilen, was Ingenieurteams erlaubt, Routineaufgaben zu delegieren und sich auf strategische, kreative Arbeiten zu konzentrieren.
Devin verkörpert eine transformative Zukunft für die Softwareentwicklung, in der KI-Mitarbeiter unter menschlicher Aufsicht agieren.
Vielseitigkeit in der Bearbeitung von Entwicklungsaufgaben
Laut Wus Demonstrationen meistert Devin verschiedene Aufgaben, darunter die vollständige Bereitstellung von Apps und Websites, die Identifizierung und Behebung von Fehlern sowie fortgeschrittene Projekte wie die Feinabstimmung großer Sprachmodelle, die mit Forschungsrepositorien auf GitHub verbunden sind.
In einem Beispiel lernte Devin aus einem Blogbeitrag, um Bilder mit versteckten Botschaften zu erzeugen. In einem anderen Fall managte es erfolgreich ein Upwork-Projekt zur Entwicklung eines Computer-Vision-Modells.
Im SWE-bench-Test – einer Bewertung mit realen, offenen GitHub-Problemen – löste Devin 13,86 % der Herausforderungen autonom. Zum Vergleich: Claude 2 löste 4,80 %, während SWE-Llama-13b und GPT-4 lediglich 3,97 % und 1,74 % lösten, wobei sie alle menschlicher Anleitung bedurften.
Kerntechnologie bleibt vertraulich
Die Präsenz von KI in der Softwareentwicklung ist nicht neu; Werkzeuge wie GitHub Copilot, StarCoder und Codeium sind bereits länger verfügbar. Die meisten konzentrieren sich jedoch darauf, das Programmieren zu unterstützen, statt komplette Projekte eigenständig zu managen. Devin von Cognition stellt einen bedeutenden Fortschritt dar, da er als vollständig autonomer KI-Ingenieur fungiert.
Obwohl Devin noch getestet wird, hebt sich seine Fähigkeit, vielschichtige Ingenieurprojekte autonom zu bewältigen, deutlich ab. Cognition hat nicht offengelegt, ob es ein proprietäres Modell oder eine Drittanbieter-Lösung verwendet, betont jedoch Fortschritte im langzeitlichen Denken und in der Planung als Schlüssel zu seiner Funktionalität.
Das Unternehmen erweitert derzeit seine Kapazitäten und gewährt ausgewählten Nutzern frühzeitigen Zugang. Interessierte Personen, die ihre Ingenieursfähigkeiten verbessern möchten, können sich per E-Mail melden. Breitere Zugänge werden in Zukunft erwartet.
Cognition deutet an, dass Codierung "nur der Anfang" sei und plant, ähnliche KI-Agenten in anderen Bereichen zu entwickeln. Bisher hat das Unternehmen 21 Millionen Dollar an Finanzierung gesichert.