Mistral推出Codestral Mamba：加速擴展程式碼生成速度

Home AI新聞 Mistral推出Codestral Mamba：加速擴展程式碼生成速度

資金充裕的法國人工智慧初創公司 Mistral，以其先進的開源 AI 模型聞名，近期推出兩款新型大型語言模型（LLMs）：一款專注於數學的模型和一款為開發者設計的程式碼生成模型，均基於去年研究人員介紹的創新 Mamba 架構。

Mamba 的目標是提升傳統轉換器架構的效率，通過精簡注意力機制來實現。這一進步使基於 Mamba 的模型能夠獲得更快的推理時間，並支持更長的上下文，從而與典型的轉換器模型區別開來。其他公司，如 AI21 也已發布採用該架構的 AI 模型。

Mistral 的新款 Codestral Mamba 7B 設計為快速響應，即使輸入文本較長，仍適合本地編程項目。該模型可在 Mistral 的 la Plateforme API 上使用，處理最多達 256,000 個令牌，這是 OpenAI 的 GPT-4 的兩倍容量。

在基準測試中，Codestral Mamba 的表現超過了多個競爭對手的開源模型，如 CodeLlama 7B、CodeGemma-1.17B 和 DeepSeek，在 HumanEval 評估中均有優異成績。

開發者可以通過其 GitHub 和 HuggingFace 倉庫在 Apache 2.0 開源許可下修改和部署 Codestral Mamba。Mistral 也表示，早期版本的 Codestral 已經超越其他代碼生成器，包括 CodeLlama 70B 和 DeepSeek Coder 33B。

隨著 AI 驅動的代碼生成和編碼助手工具成為必需應用，像 GitHub 的 Copilot、Amazon 的 CodeWhisperer 和 Codenium 等平台也逐漸受到關注。

Mistral 的第二款產品 Mathstral 7B 專注於數學推理和科學發現，並與 Project Numina 合作開發。Mathstral 擁有 32k 的上下文窗口，在 Apache 2.0 開源許可下運行，並在所有現有的數學推理模型中表現卓越。它在需要大量推理計算的基準測試中提供了「顯著更佳的結果」，用戶可以選擇直接使用或根據特定需求進行微調。

Mistral 在部落格中分享道：「Mathstral 展現了為專門應用構建模型時，性能與速度的優良平衡——這是我們在 la Plateforme 所堅持的理念，尤其是在其增強的微調能力方面。」

Mathstral 可通過 Mistral 的 la Plateforme 和 HuggingFace 獲得。

在與 OpenAI 和 Anthropic 等行業領導者的競爭中，Mistral 最近獲得了 6.4 億美元的 B 輪融資，使其估值接近 60 億美元，並吸引了包括 Microsoft 和 IBM 在內的科技巨頭投資。

Cohere 與 Fujitsu 攜手推出「Takane」－一款為企業量身打造的日本大型語言模型 (LLM)

微軟的新數據治理解決方案實現每月200%的增長

Most people like

elsaspeak

透過 ELSA 的創新 AI 驅動應用程式，輕鬆提升您的英語發音。

英語發音 Other

PDF Flex

35.3K

解鎖與您的 PDF 文件互動的新方式！我們創新的聊天功能讓您可以提問、檢索信息並直接從 PDF 中提取關鍵數據。通過與您的文檔無縫互動，簡化工作流程並提升生產力—所有這一切都是即時的。無論您是學生、專業人士還是研究者，這個工具都改變了您處理 PDF 的方式，使信息獲取比以往任何時候都更簡單。

PDF 轉換器 AI PDF

Reworkd AI

309.5K

網路數據提取的AI代理介紹在大數據時代，從網路中提取有價值的信息已成為企業和研究者的重要任務。AI代理正在革命化這一過程，通過自動化網路數據提取，讓用戶能夠高效而準確地獲取洞察。這些智能代理利用先進的算法和機器學習技術，簡化了篩選大量線上信息的任務，將原始數據轉變為可行的智能。探索AI代理如何改變網路數據提取的格局以及它們為當今數位世界中的組織所帶來的眾多好處。

網頁資料擷取 AI Advertising Assistant

Questgen - AI Powered Quiz Generator

54.5K

利用我們的人工智慧測驗生成器，將任何文本轉換為引人入勝的測驗。輕鬆創建互動式評估，提升學習和記憶，讓教育更易於接受且更具樂趣。這款工具非常適合教育工作者、學生或任何希望測試知識的人，簡化了測驗製作過程並提高理解能力。與我們創新的測驗生成器一起探索學習的未來！

AI 測驗生成器 AI Content Generator

Find AI tools in YBX