Mistral AI推出Mistral Large,并与微软达成合作
Mistral是一家以其独特的Word Art标志和在欧洲创下的创纪录种子融资而闻名的创新AI初创公司,近日推出了其迄今为止最大规模的企业模型——Mistral Large。同时,该公司还与微软建立了战略合作关系,获得1600万美元的新资金,并通过Azure增强了分销能力。
Mistral Large的关键特点
Mistral Large现已上线,是一款强大的文本生成模型,擅长处理复杂的多语言任务,包括文本理解、转换和代码生成。根据多任务语言理解(MMLU)基准测试,它在可通过API访问的模型中排名第二,仅次于GPT-4。
Mistral Large主要通过API和Azure AI提供,支持多种语言,包括英语、法语、西班牙语、德语和意大利语。尽管Google和OpenAI也提供多语言模型,Mistral声称其模型在语法和文化细微差别的理解上表现更为卓越,从而提高了性能。
凭借32K的上下文窗口,Mistral Large在处理大型文档和准确回忆信息方面表现出色。该模型还具备精准的指令执行能力,允许开发者定制其管理政策和原生函数调用。
尽管Mistral Large与能处理多达100万标记的Gemini 1.5进行了比较,Mistral仍报告其在对抗竞争模型方面取得了良好表现。MMLU测试结果显示,Mistral Large的准确率为81.2%,仅次于GPT-4的86.4%。值得注意的是,其特定语言的表现超越了Meta的同类产品。
然而,Mistral Large在编码任务方面存在短板,其在HumanE基准测试中的准确率为45.1%,低于GPT-3.5、GPT-4和Gemini Pro 1.0。
Mistral Small的优化与分发
除Mistral Large外,Mistral还发布了优化版的Mistral Small,旨在提高延迟和降低成本。该模型为Mistral的开源模型和Mistral Large之间的中间选项。
与微软的合作对扩展Mistral的市场影响至关重要。在此次合作中,Mistral的模型将可在Azure AI Studio和Azure Machine Learning上使用,这使Mistral成为第二家能够在Azure上提供商业语言模型的公司。Azure用户可以使用现有积分无缝访问Mistral的API,同时享受直接支持服务。
Mistral AI的联合创始人兼首席执行官Arthur Mensch表示:“在Mistral AI,我们让生成性AI无处不在——通过我们的开源模型以及在开发者创作的平台上推出我们的商业模型。我们很自豪地宣布Mistral Large在Azure AI上的推出。微软对我们模型的信任标志着我们在民主化前沿AI之路上的进步。”
未来展望与聊天应用发布
Mistral还计划与亚马逊网络服务(AWS)合作,使其开源模型在Amazon Bedrock上运行,但整合的时间表尚未透露。
为建立信任并展示其潜在应用,Mistral推出了一款聊天应用——一款多语言的对话助手,帮助团队探索模型的能力。用户可以在Mistral的网站上申请内测,但公司提醒该助手无法访问互联网,可能在某些情况下提供过时或不准确的信息。企业版也在开发中,具备自我部署和高级管理能力。
Mistral已成功通过种子轮和A轮融资筹集超过5亿美元,得到了Lightspeed Venture Partners和Andreessen Horowitz (a16z)等知名投资者的支持。