A Cognition recentemente chamou a atenção com seu engenheiro de software impulsionado por IA, Devin, que pode escrever e editar código de forma autônoma usando o GPT-4 da OpenAI. No entanto, apenas cinco meses após o lançamento do Devin em março de 2024, um novo concorrente surgiu: o Genie da Cosine.
Desenvolvido pela Cosine, apoiada pelo Y Combinator, o Genie, um engenheiro de IA autônomo, afirma superar o Devin com uma pontuação de 30% no benchmark SWE-Bench, significativamente maior que os 13,8% do Devin e melhor que os 19% dos modelos Q e Code Droid da Amazon. O CEO da Cosine, Alistair Pullen, enfatiza que o Genie vai além das pontuações de benchmark. "Este modelo foi especificamente treinado para pensar e agir como um engenheiro de software humano," declarou nas redes sociais.
O Que É o Genie e O Que Ele Pode Fazer?
O Genie é projetado para executar uma variedade de tarefas de codificação de forma autônoma — desde correção de erros até a construção de recursos e validação de código. Ele pode operar de forma independente ou colaborar com usuários, mimetizando a experiência de trabalhar ao lado de um colega habilidoso. “Nossa meta é criar um colega artificial capaz de realizar tarefas de programação de ponta a ponta de maneira confiável,” observou Pullen durante o anúncio das capacidades do Genie.
O Genie suporta 15 linguagens de programação, incluindo:
- JavaScript
- Python
- TypeScript
- Java
- C
- C++
- Rust
- Swift
- PHP
- Ruby
Pullen explica: “Ao observar como os engenheiros humanos trabalham, o Genie aprende a replicar seus processos.” O código gerado é armazenado nos repositórios GitHub dos usuários, garantindo que a Cosine não retenha informações sensíveis.
O Genie integra-se perfeitamente a plataformas como o Slack, permitindo que se comunique com os usuários de forma semelhante a um colega humano. Ele pode fazer perguntas para esclarecer pontos e responder a feedback sobre pull requests, aprimorando ainda mais a colaboração.
Impulsionado por um Modelo Avançado da OpenAI
O Genie utiliza uma variante proprietária do GPT-4 da OpenAI, especialmente projetada para saídas de longo contexto. Este modelo pode gerar até 64.000 tokens, oferecendo vantagens significativas em relação às versões anteriores, que eram limitadas a 4.000 tokens.
Com um dataset extenso composto por bilhões de combinações de tokens, curados a partir de atividades reais de engenharia, o Genie melhora continuamente seu desempenho. “Nossos dados de treinamento incluem PRs, commits e issues coletados de repositórios de código aberto,” comentou Pullen. O meticuloso pipeline de dados garante insights de alta qualidade sobre as abordagens de resolução de problemas humanos.
Estrutura de Preços
O Genie inicialmente oferecerá dois planos de preços:
1. Plano Individual: Com preço competitivo em torno de $20, este plano tem capacidades limitadas, mas demonstra o potencial do Genie para indivíduos e pequenas equipes.
2. Plano Empresarial: Esta oferta abrangente inclui uso ilimitado e recursos avançados projetados para criar um excepcional colega de engenharia em IA.
Implicações e Perspectivas Futuras
As capacidades avançadas do Genie têm o potencial de revolucionar o desenvolvimento de software, aumentando a eficiência e permitindo que as equipes de engenharia se concentrem em objetivos estratégicos. “A capacidade de uma IA lidar com bases de código complexas de forma autônoma pode mudar radicalmente nossa abordagem à alocação de recursos,” disse Pullen.
A Cosine busca expandir as funcionalidades do Genie, desenvolvendo modelos menores para tarefas básicas e versões maiores para desafios complexos. Colaborações com comunidades de código aberto também estão nos planos.
Próximos Passos e Disponibilidade
Embora o Genie esteja sendo oferecido atualmente para usuários selecionados, partes interessadas podem se inscrever para acesso antecipado através do site da Cosine. A Cosine está comprometida com a melhoria contínua, incorporando o feedback dos usuários para aprimorar as capacidades do Genie. Além disso, a Cosine pretende manter alguns aspectos proprietários de sua metodologia, compartilhando de forma transparente as saídas do Genie no GitHub para verificação independente.
Sobre a Cosine
Fundada em 2022 por Pullen, Sam Stenner e Yang Li, a Cosine se dedica a aplicar o raciocínio humano a problemas complexos em inteligência artificial, começando pela engenharia de software. Com $2,5 milhões em financiamento inicial, a Cosine tem como objetivo redefinir como a IA pode imitar e inovar em tarefas humanas. “Acreditamos que podemos traduzir o raciocínio humano para qualquer setor, começando pela engenharia de software,” afirmou Pullen. O lançamento do Genie é apenas o início da ambiciosa jornada da Cosine.