今日,總部位於巴黎的AI新創公司Mistral,在去年創下歐洲史上最大種子輪融資的消息後,正式推出其首款專注於代碼的語言模型Codestral,進軍程式設計與開發領域。
Codestral目前以非商業授權形式提供,擁有220億個參數的開放權重生成性AI模型,專精於包括代碼生成和實施等各項程式設計任務。Mistral表示,該模型支援超過80種編程語言,是尋求構建創新AI應用程式的軟體開發者的重要資源。該公司聲稱,Codestral優於先前的代碼模型,包括CodeLlama 70B和Deepseek Coder 33B,並已被JetBrains、SourceGraph和LlamaIndex等行業領導者所採用。
高效能的開發者工具
Codestral 22B具備32K的上下文長度,使開發者能在不同環境和專案中輕鬆處理代碼。經過涵蓋超過80種編程語言的數據集訓練後,它可應對各種編程任務,如從零開始生成代碼、補全函數、撰寫測試以及填補部分代碼的空缺。支援的語言包括SQL、Python、Java、C和C++等熱門選項,還有 Swift 和 Fortran 等小眾選擇。Mistral聲稱,Codestral能提升開發者的生產力,簡化工作流程,顯著節省時間並降低應用開發過程中的錯誤可能性。
儘管該模型剛剛推出並等待公眾測試,Mistral對其性能充滿信心,認為它在大多數編程語言中超越目前的模型,包括CodeLlama 70B、Deepseek Coder 33B 和 Llama 3 70B。
出色的性能指標
在評估長距離倉庫級Python代碼補全的RepoBench上,Codestral獲得了34%的準確率,領先所有競爭對手。在Python代碼生成的HumanEval和輸出預測的CruxEval中,它的分別得分為81.1%和51.3%。此外,在HumanEval針對Bash、Java和PHP的測試中也表現優異。儘管在C++、C和Typescript的表現略低,但在所有測試中的平均得分為61.5%,仍優於Llama 3 70B的61.2%。在SQL的Spider評估中,Codestral以63.5%的得分位居第二。
包括LlamaIndex、LangChain、Continue.dev、Tabnine和JetBrains等開發者生產力和AI應用開發的重要工具,已開始測試Codestral。LangChain的首席執行官兼聯合創始人Harrison Chase表示:“從我們的初步測試來看,由於其速度、友好的上下文窗口和工具支援,它是一個優秀的代碼生成工作流程選擇。我們也使用LangGraph進行自我修正的代碼生成,表現非常出色。”
開始使用Codestral
Mistral在Hugging Face上以非生產性授權提供Codestral 22B,允許開發者在非商業用途、測試和研究支援下使用該技術。還有兩個API端點可用:codestral.mistral.ai,用於IDE中的指令或填補方案,並在八週免費測試期內提供用戶管理的API密鑰;api.mistral.ai則針對更廣泛的研究、批量查詢或第三方應用開發,按令牌計費。開發者還可以透過Mistral的免費對話介面Le Chat探索Codestral的能力。
Mistral推出Codestral為企業研究者加速軟體開發提供了一個重要選項,但其相較於StarCoder2等近期推出的代碼導向模型以及OpenAI和Amazon的產品表現仍需觀察。OpenAI的Codex(支持GitHub Copilot)和Amazon的CodeWhisper是關鍵競爭者。此外,OpenAI的ChatGPT正日益被用作編程工具,而其GPT-4 Turbo模型驅動的Devin則是Cognition開發的半自動編碼代理。競爭生態還包括Replit,提供多款小型AI編碼模型,以及最近以5億美元估值的Codenium,後者在6500萬美元的B輪融資後獲得了此評價。