Hoje, a Cognition, uma startup de inteligência artificial apoiada pelo Founders Fund de Peter Thiel, além de líderes do setor como o ex-executivo do Twitter Elad Gil e o cofundador do DoorDash Tony Xu, apresentou o "Devin", um engenheiro de software autônomo totalmente independente.
Diferente dos assistentes de codificação existentes, como o GitHub Copilot, Devin se destaca ao gerenciar projetos de desenvolvimento do início ao fim. Isso inclui codificação, depuração e execução de projetos, tudo isso demonstrando suas capacidades em plataformas como Upwork.
O lançamento do Devin representa uma evolução crucial no desenvolvimento de software assistido por IA, oferecendo aos engenheiros um trabalhador de IA abrangente, em vez de apenas uma ferramenta para escrever trechos de código simples. Atualmente, o Devin não está disponível publicamente. O acesso limitado foi concedido a um grupo seleto de usuários, incluindo a jornalista da Bloomberg Ashlee Vance, que compartilhou suas experiências com o software.
Quais são as funcionalidades do Devin?
O CEO da Cognition, Scott Wu, detalhou as capacidades do Devin em um post de blog, destacando seu acesso a ferramentas essenciais para desenvolvedores—como um editor de código e navegador—dentro de um ambiente seguro e isolado. Devin pode lidar com tarefas de engenharia complexas que geralmente envolvem milhares de decisões.
Os usuários apenas precisam inserir comandos em linguagem natural na interface de chat do Devin, que então elabora um plano passo a passo para abordar a tarefa. Devin escreve código de forma autônoma, resolve problemas, realiza testes e entrega atualizações de progresso em tempo real, permitindo que os usuários acompanhem o projeto facilmente.
Caso os usuários notem alguma discrepância, podem interagir diretamente pela interface de chat para emitir comandos, permitindo que as equipes de engenharia deleguem tarefas rotineiras e se concentrem em trabalhos criativos de nível superior. Devin exemplifica um futuro transformador para o desenvolvimento de software, onde trabalhadores de IA operam sob supervisão humana.
Versatilidade na execução de tarefas de desenvolvimento
De acordo com as demonstrações de Wu, Devin se destaca em diversas tarefas, incluindo a implantação de aplicativos e websites do início ao fim, identificação e resolução de bugs, e até projetos avançados, como o aprimoramento de grandes modelos de linguagem ligados a repositórios de pesquisa no GitHub.
Em uma das situações, Devin aprendeu com um post de blog a produzir imagens com mensagens ocultas, enquanto em outra, conseguiu gerenciar um projeto no Upwork relacionado ao desenvolvimento de modelos de visão computacional.
No teste SWE-bench—uma avaliação utilizando problemas de código aberto reais do GitHub—Devin resolveu 13,86% dos desafios de forma autônoma. Em comparação, Claude 2 resolveu 4,80%, enquanto SWE-Llama-13b e GPT-4 solucionaram 3,97% e 1,74%, respectivamente, todos exigindo orientação humana.
Tecnologia central ainda não divulgada
A presença da IA no desenvolvimento de software não é novidade; ferramentas como GitHub Copilot, StarCoder e Codeium já estão disponíveis há tempo. Contudo, a maioria foca na complementação da codificação, e não na gestão independente de projetos inteiros. O Devin da Cognition representa um salto significativo, funcionando como um engenheiro de IA totalmente autônomo.
Embora ainda esteja em fase de testes, a capacidade do Devin de navegar por projetos de engenharia multifacetados de forma autônoma o diferencia. A Cognition não revelou se utiliza um modelo proprietário ou uma solução de terceiros, mas enfatiza os avanços no raciocínio a longo prazo e no planejamento como fundamentais para sua funcionalidade.
A empresa está atualmente ampliando sua capacidade e estendendo o acesso inicial a usuários selecionados. As partes interessadas que desejam aprimorar suas capacidades de engenharia podem entrar em contato pelo e-mail, com previsão de acesso mais amplo no futuro. A Cognition indica que a codificação é “apenas o começo”, sugerindo planos para desenvolver agentes de IA semelhantes em outras áreas. Até agora, a empresa garantiu US$ 21 milhões em financiamento.