Cognition недавно привлекла внимание своим программным инженером на базе ИИ, Devin, который может самостоятельно писать и редактировать код, используя GPT-4 от OpenAI. Однако всего через пять месяцев после запуска Devin в марте 2024 года на арене появился новый соперник: Genie от компании Cosine.
Genie, автономный ИИ-инженер, разработанный при поддержке Y Combinator, утверждает, что превосходит Devin, набирая 30% на бенчмарке SWE-Bench, что значительно выше 13,8% Devin и лучше, чем 19% моделей Amazon — Q и Code Droid от Factory. Генеральный директор Cosine, Алистер Пуллен, подчеркивает, что Genie предлагает не только высокие показатели. "Эта модель была специально обучена мыслить и действовать как человеческий программный инженер", — отметил он в социальных сетях.
Что такое Genie и что он может делать?
Genie предназначен для автономного выполнения различных задач программирования — от исправления ошибок до создания функций и валидации кода. Он может работать независимо или сотрудничать с пользователями, имитируя опыт работы с опытным коллегой. «Мы стремимся создать искусственного коллегу, способного надежно выполнять задачи программирования от начала до конца», — добавил Пуллен.
Genie поддерживает 15 языков программирования, включая:
- JavaScript
- Python
- TypeScript
- Java
- C
- C++
- Rust
- Swift
- PHP
- Ruby
Пуллен объясняет: «Наблюдая за работой человеческих инженеров, Genie учится воспроизводить их процессы». Сгенерированный код сохраняется в репозиториях GitHub пользователей, что гарантирует, что Cosine не хранит никакую конфиденциальную информацию.
Genie интегрируется с такими платформами, как Slack, позволяя общаться с пользователями так же, как это делал бы человеческий коллега. Он может задавать уточняющие вопросы и реагировать на обратную связь по запросам на внесение изменений, что еще больше улучшает сотрудничество.
Работа на основе Advanced OpenAI Model
Genie использует собственную версию GPT-4o от OpenAI, специально разработанную для выдачи длинных контекстов. Эта модель может генерировать до 64 000 токенов, что предоставляет значительные преимущества по сравнению с предыдущими версиями, ограниченными 4 000 токенами.
С обширным набором данных, состоящим из миллиардов комбинаций токенов, собранных из реальной инженерной деятельности, Genie постоянно улучшает свою производительность. "Наши тренировочные данные включают PR, коммиты и проблемы, собранные из репозиториев с открытым исходным кодом", — прокомментировал Пуллен. Тщательная обработка данных обеспечивает высокое качество понимания человеческих подходов к решению проблем.
Структура цен
Genie изначально предложит два уровня цен:
1. Индивидуальный план: Конкурентоспособная цена около $20, этот уровень имеет ограниченные возможности, но демонстрирует потенциал Genie для индивидуальных пользователей и небольших команд.
2. Корпоративный план: Этот комплексный пакет включает неограниченное использование и расширенные функции для создания выдающегося ИИ-инженера-коллеги.
Последствия и будущее
Современные возможности Genie могут революционизировать разработку программного обеспечения, увеличивая эффективность и позволяя инженерным командам сосредотачиваться на стратегических задачах. «Способность ИИ независимо справляться со сложными кодовыми базами может радикально изменить наш подход к распределению ресурсов», — сказал Пуллен.
Cosine планирует расширить функции Genie, разработав более мелкие модели для базовых задач и более крупные версии для сложных вызовов. Планы по сотрудничеству с сообществами с открытым исходным кодом также находятся на горизонте.
Следующие шаги и доступность
Хотя Genie сейчас доступен для избранных пользователей, заинтересованные могут подать заявку на ранний доступ через сайт Cosine. Компания нацелена на постоянное совершенствование, учитывая отзывы пользователей для улучшения возможностей Genie.
Кроме того, Cosine намерена сохранить некоторые аспекты своей методологии в секрете, при этом прозрачно делясь выводами Genie на GitHub для независимой проверки.
О компании Cosine
Основанная в 2022 году Пулленом, Сэмом Стеннером и Янгом Ли, Cosine стремится применять человеческое мышление к сложным задачам в области искусственного интеллекта, начиная с программирования. С $2,5 миллиона в начальном финансировании, Cosine нацелена на переосмысление того, как ИИ может имитировать и внедрять человеческие задачи.
"Мы верим, что можем адаптировать человеческое мышление для любой отрасли, начиная с программирования", — уверил Пуллен. Запуск Genie — это только начало амбициозного пути Cosine.