中国のDeepSeek Coder：GPT-4 Turboを超える初のオープンソースコーディングモデル

Home AIニュース中国のDeepSeek Coder：GPT-4 Turboを超える初のオープンソースコーディングモデル

中国のAIスタートアップDeepSeekが、2兆トークンによって英語と中国語でトレーニングされたChatGPTの競合製品を開発したことで知られており、コード生成のためのオープンソースMixture of Experts（MoE）モデル「DeepSeek Coder V2」を発表しました。

先月リリースされたDeepSeek-V2の成功を基に、DeepSeek Coder V2は、300以上のプログラミング言語に対応し、コーディングと数学的なタスクで優れた性能を発揮します。このモデルは、GPT-4 Turbo、Claude 3 Opus、Gemini 1.5 Proなどの主流のクローズドソースモデルを上回り、Llama 3-70Bなど同カテゴリーの他のモデルを超える初のオープンモデルとして大きなマイルストーンとなりました。

2022年に設立されたDeepSeekは、「好奇心を持ってAGIの謎を解き明かす」という目標を掲げています。創立からわずか1年で、DeepSeek Coderファミリーなど、いくつかのモデルをオープンソース化しました。初代DeepSeek Coderは330億パラメータを持ち、プロジェクトレベルのコード補完や編集において良好に機能しましたが、86のプログラミング言語をサポートし、文脈ウィンドウは16Kでした。新しいV2では、言語サポートが338に拡大し、文脈ウィンドウは128Kに増加し、より複雑なコーディングの課題に挑戦できるようになりました。

DeepSeek Coder V2は、コード生成、編集、問題解決能力を評価するために設計された、MBPP+、HumanEval、Aiderなどのベンチマークでそれぞれ76.2、90.2、73.7のスコアを達成し、多くのクローズド・オープンソースモデルを凌駕しました。数学的なベンチマーク（MATHおよびGSM8K）でも同様に強力な結果を示しました。

他のベンチマークでDeepSeek Coder V2を超えたモデルはGPT-4oのみで、HumanEval、LiveCode Bench、MATH、GSM8Kでわずかに高いスコアを記録しています。この進歩は、主にGitHubとCommonCrawlから集めた、プログラムと数学に特化した6兆トークンの大規模データセットを事前学習に使用したDeepSeek V2から派生したものです。

モデルは16Bおよび236Bのパラメータオプションがあり、特定のタスクに対して2.4Bおよび21Bのエキスパートパラメータのみを活性化し、計算効率を最適化します。

コーディングの能力に加え、DeepSeek Coder V2は一般的な推論や言語理解能力も強く示しています。例えば、MMLUベンチマークでは79.2のスコアを記録し、他のコード固有モデルを上回り、Llama-3 70Bとほぼ同水準です。MMLUカテゴリでは、GPT-4oとClaude 3 Opusがそれぞれ88.7と88.6のスコアでリードしています。

この進展は、オープンソースのコーディングモデルがより広範な応用で進化していることを示し、クローズドソース技術とますます競合していることを示しています。

DeepSeek Coder V2はMITライセンスのもとで利用可能で、研究および商業利用が可能です。ユーザーはHugging Faceから指示型と基本構成の16Bおよび236Bモデルをダウンロードするか、DeepSeekプラットフォームのAPIを通じて従量課金制でアクセスできます。

DeepSeek Coder V2の能力を探るために、ユーザーは同社のプラットフォーム上のチャットボットを介してインタラクションすることができます。

Auggie Studios: マーケターと企業向けのAI動画制作を革新するCanvaのようなプラットフォーム

Runway共同創設者兼CTO、プレミアム会員向けに間もなく発表されるGen-3アルファ版のリリースを発表

Most people like

MachineTranslation.com

693.6K

要約：MachineTranslation.comは、人工知能と機械学習を活用し、グローバルなコミュニケーションを向上させる最先端のオンラインプラットフォームであり、アクセスしやすく信頼性の高い機械翻訳ソリューションを提供しています。

機械翻訳 Translate

Cliplama

109.3K

自動動画制作でソーシャルメディア戦略を合理化しましょう。今日の急速なデジタル環境では、魅力的な動画コンテンツがオーディエンスの関心を引くために不可欠です。自動化ツールは、動画制作の方法を革新し、魅力的なストーリーを共有し、製品を紹介し、フォロワーとつながることをより簡単かつ迅速にします。オンラインプレゼンスを強化したいブランドや、リーチを広げたい個人クリエイターにとって、自動動画制作がどのようにソーシャルメディアを向上させるかを見つけてみましょう。

AI動画作成 Text to Video

WhisperUI

28.4K

手頃な価格のテキスト読み上げと音声認識サービスを発見し、書かれたコンテンツをリアルな音声に変え、話された言葉を正確なテキストに変換します。ビジネス、教育者、個人の皆様に最適なこの革新的なソリューションは、アクセシビリティと効率を向上させます。プレゼンテーションの音声作成や会議の文字起こしが必要な際にも、私たちの多機能サービスはすべてのニーズに応えます。シームレスなコミュニケーションと生産性向上を今すぐ体験してください！

テキスト読み上げ AI Speech Recognition

Knowt

あなたの学習力を引き出すAI搭載の学習アプリで、インタラクティブなフラッシュカード、包括的な学習ガイド、効果的な模擬試験を活用しましょう。成功のために設計されたカスタマイズツールで、学習セッションを充実させ、記憶力を高めましょう。

AI駆動フラッシュカード AI Education Assistant

Find AI tools in YBX