アリババ、オープンソースのQwen 1.5-110Bモデルを発表 - MetaのLlama 3-70Bと同等の性能を実現

Home AIニュースアリババ、オープンソースのQwen 1.5-110Bモデルを発表 - MetaのLlama 3-70Bと同等の性能を実現

最近、AlibabaはQwen1.5Siriーズの最初の1100億パラメータモデル「Qwen1.5-110B」をオープンソースとして公開しました。この取り組みは、Alibabaの人工知能における革新力を示すだけでなく、中国企業が大規模言語モデルの開発において大きな進展を遂げていることを強調しています。

Qwen1.5-110Bモデルは、トランスフォーマー・デコーダーアーキテクチャを採用し、Grouped Query Attention（GQA）技術を取り入れることで、推論の効率を向上させています。最大32,000トークンのコンテキスト長をサポートし、英語、中国語、フランス語、スペイン語、ドイツ語、ロシア語、日本語、韓国語、ベトナム語などの複数の言語を処理する能力があります。

性能評価では、Qwen1.5-110BがMetaのLlama3-70Bと強く競合し、プレトレーニング手法に大きな変更を加えることなくその競争力を維持しています。Alibabaは、このモデルの性能向上は主にそのスケールの拡大に起因するとしています。この成果は、Alibabaのモデル設計および最適化における専門知識を反映しており、中国における大規模言語モデルの開発に新たな活力を注ぎ込んでいます。

さらに、Qwen1.5-110Bはチャット評価でも優れた結果を示しており、MT-BenchやAlpacaEval 2.0の評価において前の72Bモデルに対して大きな優位性を発揮しています。これは、より大きな基盤言語モデルがチャットモデルの性能を大きく向上させることができることを強く示しています。

Alibabaは、Qwen1.5-110BがSiriーズ最大のモデルであり、1000億パラメータを超える初のモデルであると強調しています。この成果は、大規模言語モデル分野でのAlibabaのリーダーシップを固めるだけでなく、グローバルAIの舞台における中国企業の声を高めることにも貢献します。

AI技術の進展が続く中、大規模言語モデルは多くのテクノロジー企業にとって焦点となっています。Qwen1.5-110Bのオープンソースリリースは、開発者にとって優れたツールを提供し、AI技術の普及と応用を促進します。

今後、中国企業が大規模言語モデルの分野でさらなるブレイクスルーを生み出し、革新的なアイデアでAI技術の発展をさらに豊かにしていくことが期待されます。

Viduローンチ：Sora品質に匹敵する驚異の16秒HD動画を瞬時に作成

簡単に美しいプレゼンテーションを作成するための10のツール：1クリックで魅力的なPPTを生成！

Most people like

Metaphysic.ai

46.3K

Metaphysic.aiは、ハイパーリアリスティックなAI生成動画コンテンツの最前線に立ち、デジタルストーリーテリングを再定義する驚くべきビジュアルを提供しています。

生成AI AI Content Generator

Elephant.ai

59.9K

ようこそ、Elephant.aiへ。あなたのウェブサイトの訪問者一人ひとりに対してカスタマイズされた応答を提供するために設計されたパーソナライズチャットボットです。私たちのインテリジェントなAIソリューションで、ユーザーエンゲージメントと満足度を向上させましょう。

チャットボット AI Chatbot

Glass

78.9K

最先端のAI技術を活用したプラットフォームを紹介します。これは、診断の向上と情報に基づく意思決定を目的とした革新的なソリューションです。このプラットフォームは、最新の人工知能技術を駆使して医療プロセスを効率化し、アウトカムを最適化し、医療従事者を支援します。当プラットフォームがどのように診断を変革し、臨床判断を強化して患者ケアの向上に寄与するかをぜひご覧ください。

AI支援診断 Other

CharGen

14.9K

あなたのTTRPGやD&Dキャラクターのために、息を呑むようなAI生成アートを解き放とう。あなたの想像力豊かな創造物を見事なビジュアルの芸術作品に変えよう！

テーブルトークRPG AI Character

Find AI tools in YBX