MistralAIコミュニティを驚かせる - 新しいオープンソースモデルがGPT-3.5の性能を超える

Mistralは、ヨーロッパの企業史上最も資金調達に成功したスタートアップで、フランス発のオープンソースAIモデルと大規模言語モデル(LLM)に特化した会社です。最近、同社は新しいモデル「Mixtral 8x7B」のリリースでAIコミュニティに衝撃を与えました。この革新的なモデルは、「専門家の混合」アプローチを採用しており、異なるタスクを得意とするさまざまな専門モデルを組み合わせています。

Mistralは、Mixtral 8x7Bを説明やブログ記事、デモビデオなしにトレントリンクで静かにリリースしました。このユニークなアプローチにより、XやLinkedInなどのプラットフォームで初期ユーザーやAIインフルエンサーから即座に注目が集まりました。

本日、MistralはMixtral 8x7Bの性能ベンチマークを詳細に説明するブログ記事を発表しました。このモデルは、OpenAIの独自モデルであるGPT-3.5や、オープンソースAI分野でのリーダーだったMetaのLlama 2と同等、またはそれを上回る性能を誇っています。Mistralは、モデルのトレーニング中にCoreWeaveとScalewayとの技術支援を受けたことを発表し、Mixtral 8x7BはApache 2.0ライセンスの下で商業利用可能であると確認しました。

初期ユーザーはすでにMixtral 8x7Bをダウンロードしており、その性能に感銘を受けています。このコンパクトな設計により、最新のM2 Ultra CPUを搭載したAppleのMacコンピュータなど、標準の機器上でのローカル実行が可能です。

特に、ペンシルバニア大学ウォートン校のイーサン・モリック教授は、XにおいてMixtral 8x7Bには「安全ガードレールがないようだ」と指摘しています。この特性は、OpenAIの厳格なコンテンツポリシーに不満を持つユーザーにとって魅力的で、その他のモデルによって「安全でない」とされるコンテンツを生成することを可能にします。ただし、このガードレールの欠如は、政策立案者や規制当局にとって潜在的な課題をもたらします。

Mixtral 8x7BはHuggingFaceを通じて直接体験できます(リンクを提供してくれたMerve Noyanに感謝)。HuggingFaceの実装にはガードレールが組み込まれており、物議を醸すプロンプトを使用したテストでは、ナパームの生成手順を提供することを拒否しました。

さらに、Mistralはさらに強力なモデルの開発にも着手しています。HyperWrite AIのCEOであるマット・シューマーは、X上でMistral-mediumのアルファ版がAPI経由でローンチされたと述べており、より大規模で進んだモデルの登場が期待されています。

Mistralは最近、A16z主導の4億1500万ドルのSiriーズA資金調達を完了し、企業の評価額は20億ドルに達しました。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles