Mistral推出Codestral Mamba：加速与延伸代码生成速度

Home AI News CN Mistral推出Codestral Mamba：加速与延伸代码生成速度

资金充裕的法国人工智能初创公司Mistral以其先进的开源AI模型而闻名，最近推出了两款新的大型语言模型（LLMs）：一款专注于数学的模型以及一款为开发者设计的代码生成模型。这两款模型均基于去年研究人员推出的创新Mamba架构。

Mamba旨在通过简化注意力机制来提高传统变换器架构的效率。这一进展使得基于Mamba的模型实现了更快的推理速度，并能够支持更长的上下文，从而与普通变换器模型形成差异。其他公司，如AI21，也推出了利用这一架构的AI模型。

Mistral的新款Codestral Mamba 7B专为快速响应而设计，即使处理大型输入文本也表现出色，非常适合本地编码项目。它可以在Mistral的la Plateforme API上使用，支持最大256,000个标记的输入，容量是OpenAI的GPT-4的两倍。

在基准测试中，Codestral Mamba在HumanEval评估中超越了多款竞争对手的开源模型，包括CodeLlama 7B、CodeGemma-1.17B和DeepSeek。开发者可以通过其GitHub仓库和HuggingFace平台根据Apache 2.0开源许可证修改和部署Codestral Mamba。Mistral声称，早期版本的Codestral已超越其他代码生成器，如CodeLlama 70B和DeepSeek Coder 33B。

人工智能驱动的代码生成和编码助手工具已成为必不可少的应用，像GitHub的Copilot、亚马逊的CodeWhisperer以及Codenium等平台正在受到广泛关注。

Mistral的第二款产品Mathstral 7B专注于数学推理和科学发现，与Project Numina合作开发，支持32k的上下文窗口，采用Apache 2.0开源许可证，其表现超过当前所有数学推理模型。在需要重推理时间计算的基准测试中，Mathstral提供了“显著更好的结果”，用户可选择直接使用或根据特定需求进行微调。

Mistral在一篇博客中表示：“Mathstral展示了在为专用应用构建模型时，优秀性能与速度之间的理想平衡，这是我们在la Plateforme中的承诺，特别是在其增强的微调能力方面。”

Mathstral可通过Mistral的la Plateforme和HuggingFace访问。

Mistral与OpenAI和Anthropic等行业领导者展开激烈竞争，最近获得了6.4亿美元的B轮融资，估值接近60亿美元，投资方包括微软和IBM等科技巨头。

Cohere与富士通携手推出‘Takane’ – 专为企业打造的日本大型语言模型

微软新数据治理解决方案实现月增长200%

Most people like

Brella

266.3K

探索领先的活动与社交平台，连接你与周围的精彩世界。无论是寻找本地活动的热情参与者，还是希望与志同道合的人建立联系，我们的平台致力于为你提供独特的体验和丰富的社交机会。加入我们，开启你的社交之旅！

事件平台 AI产品描述生成器

PlaninGo

6.3K

AI旅行规划工具：让你的旅行计划变得有趣和互动在现代旅行中，AI旅行规划工具正成为了每位旅行者的得力助手。这些智能工具不仅简化了旅行计划的过程，还为用户提供了个性化的建议，让每一次出行都充满乐趣与创意。无论你是在寻找最佳的目的地，还是希望制定一个完美的行程，AI科技将为你创造一个前所未有的互动体验。

AI 旅行规划师 AI旅行规划师

uBrand

48.8K

用人工智能打造品牌的新时代在当今数字化飞速发展的时代，企业面临着前所未有的竞争压力。人工智能（AI）作为一种创新的技术工具，正成为品牌建设和市场营销的关键推动力. 通过深度学习和数据分析，AI帮助企业精准定位目标客户、优化营销策略，并提升客户体验，从而在激烈的市场中脱颖而出. 本文将探讨如何利用人工智能有效地塑造和提升品牌形象, 使您的企业在数字时代保持竞争优势.

人工智能 AI图形设计

Kopy

95.4K

轻松一键复制和导入各类商店产品。

产品进口电商助手

Find AI tools in YBX