最近、CognitionのAI駆動のソフトウェアエンジニア「Devin」が注目を集めました。このシステムは、OpenAIのGPT-4を利用して自律的にコードの作成や編集が可能です。しかし、Devinが2024年3月にリリースされてわずか5か月で、新たな競争相手「CosineのGenie」が登場しました。
Genieは、Y Combinatorの支援を受けたCosineによって開発された自律型AIエンジニアで、SWE-Benchベンチマークで30%を記録し、Devinの13.8%やAmazonのQおよびCode Droidモデルの19%を大幅に上回ると主張しています。CosineのCEO、アリステア・パレンは、「このモデルは人間のソフトウェアエンジニアのように思考し行動するように特別に訓練されています」とSNSで述べました。
Genieとは何か?どのような機能があるのか?
Genieは、バグ修正、機能追加、コード検証など、さまざまなコーディングタスクを自律的に行うよう設計されています。ユーザーと協力しながら作業することもでき、熟練した同僚と一緒に働いているかのような体験を提供します。「私たちは、信頼性高くエンドツーエンドのプログラミングタスクを実行できる人工の同僚を創出することを目指しています」とパレンはGenieの機能発表時に述べました。
Genieは15のプログラミング言語をサポートしています:
- JavaScript
- Python
- TypeScript
- Java
- C
- C++
- Rust
- Swift
- PHP
- Ruby
パレンは、「人間のエンジニアの作業を観察することで、Genieは彼らのプロセスを再現することを学びます」と説明しています。生成されたコードはユーザーのGitHubリポジトリに保存され、Cosineが機密情報を保持することはありません。
GenieはSlackのようなプラットフォームとシームレスに統合され、ユーザーと人間の同僚のようにコミュニケーションを取ることができます。明確化のための質問をしたり、プルリクエストへのフィードバックに応じたりして、さらなるコラボレーションを促進します。
高度なOpenAIモデルに基づくGenie
GenieはOpenAIのGPT-4oという独自のバリアントを利用しており、長い文脈の出力向けに特別に設計されています。このモデルは最大64,000トークンまで生成でき、従来の4,000トークン制限を大きく超える利点があります。
数十億のトークン組み合わせを含むデータセットを活用し、Genieは継続的にパフォーマンスを向上させています。「私たちのトレーニングデータには、オープンソースリポジトリから集めたPR、コミット、課題が含まれています」とパレンはコメントしました。この綿密なデータパイプラインにより、人間の問題解決アプローチに対する高品質な洞察が得られます。
価格体系
Genieは最初に次の2つの料金プランを提供します:
1. 個人プラン:約20ドルの競争力のある価格で、制限された機能を備えていますが、個人や小規模チームにとってGenieの可能性を示しているプランです。
2. エンタープライズプラン:無制限の使用と、優れたAIエンジニア同僚を作成するための高度な機能を含む包括的なオファーです。
影響と将来の展望
Genieの先進的な機能は、ソフトウェア開発を革命的に変える可能性を秘めており、効率を高め、エンジニアリングチームが戦略的目標に集中できるようにします。「AIが複雑なコードベースを独自に処理できる能力は、資源配分へのアプローチを根本的に変えることができます」とパレンは述べています。
Cosineは、基本タスク向けの小型モデルや複雑な課題向けの大型モデルの開発を目指してGenieの機能拡張を進めています。また、オープンソースコミュニティとのコラボレーションの計画も視野に入れています。
次のステップと利用可能性
現在、Genieは選ばれたユーザーに提供されていますが、興味のある方はCosineのウェブサイトを通じて早期アクセスを申し込むことができます。Cosineはユーザーからのフィードバックを取り入れ、Genieの能力を向上させる取り組みを続けています。
さらに、Cosineは独自のメソッドの一部を保持しつつ、Genieの出力をGitHubで透明に共有し、独立した検証を可能にすることを目指しています。
Cosineについて
2022年にアリステア・パレン、サム・ステンナー、ヤン・リーによって設立されたCosineは、ソフトウェアエンジニアリングから始めて人工知能の複雑な問題に人間の推論を応用することに専念しています。250万ドルのシード資金を調達し、CosineはAIが人間のタスクを模倣・革新できる方法を再定義することを目指しています。「私たちは、ソフトウェアエンジニアリングから始まり、どの業界でも人間の推論を翻訳できると信じています」とパレンは力を込めて述べました。Genieの発表は、Cosineの野心的な旅の始まりに過ぎません。