中國 DeepSeek Coder：首款在性能上超越 GPT-4 Turbo 的開源編碼模型

Home AI新聞中國 DeepSeek Coder：首款在性能上超越 GPT-4 Turbo 的開源編碼模型

中國人工智慧初創公司DeepSeek，以開發一款受訓於2兆個英語和中文標記的ChatGPT競爭者而聞名，最近推出了DeepSeek Coder V2，這是一款用於代碼生成的開源混合專家模型（MoE）。

DeepSeek Coder V2基於上個月推出的DeepSeek-V2的成功，在編碼和數學任務方面表現出色，支持超過300種編程語言。它在性能上超越了諸如GPT-4 Turbo、Claude 3 Opus和Gemini 1.5 Pro等領先的封閉源模型，成為第一個達到此性能水平的開放模型，超越Llama 3-70B及其類別中的其他模型。

DeepSeek成立於2022年，致力於「以好奇心揭開AGI的奧秘」。在短短一年內，該公司已開源多個模型，包括DeepSeek Coder系列。原始的DeepSeek Coder擁有330億個參數，在項目級別的代碼完成和填補方面表現良好，但僅支持86種編程語言，且上下文窗口為16K。而新版本V2將語言支持擴展至338種，並將上下文窗口增加至128K，使其能夠處理更複雜的編碼挑戰。

在評估代碼生成、編輯和問題解決能力的基準測試中，如MBPP+、HumanEval和Aider，DeepSeek Coder V2的得分分別為76.2、90.2和73.7，超越了許多封閉和開源模型，包括GPT-4 Turbo、Claude 3 Opus及Llama-3 70B。在數學基準測試（MATH和GSM8K）中，它同樣顯示出強勁的表現。

在多個基準測試中，只有GPT-4o的得分略高於DeepSeek Coder V2，尤其是在HumanEval、LiveCode Bench、MATH和GSM8K中。DeepSeek的這些進展源於DeepSeek V2，它利用Mixture of Experts框架，並在一個關注代碼和數學的6兆標記數據集上進行預訓練，數據主要來自GitHub及CommonCrawl。

該模型提供16B和236B的參數選擇，針對特定任務僅激活2.4B和21B的專家參數，從而提高計算效率。

除了強大的編碼能力，DeepSeek Coder V2在一般推理和語言理解方面也表現出色。在MMLU基準測試中取得79.2的得分，超越了其他專注於代碼的模型，並與Llama-3 70B相當。GPT-4o和Claude 3 Opus在MMLU類別中分別以88.7和88.6的分數領先。

這一發展顯示出開源編碼模型在應用範圍的進步，越來越能與領先的封閉源技術競爭。

DeepSeek Coder V2在MIT許可下發布，允許進行研究和商業使用。用戶可以通過Hugging Face下載16B和236B的模型（指令配置和基礎配置），或通過DeepSeek平台的API以按需付費的模式訪問它們。

用戶可以通過公司平台上的聊天機器人與DeepSeek Coder V2互動，深入探索其能力。

Augie Studio：為行銷人員和企業帶來AI影片製作的革命，類似Canva

Runway 共同創辦人兼首席技術官宣布，付費訂閱者將在幾天內迎來 Gen-3 Alpha 版本發佈。

Most people like

AnythingLLM

256K

發現終極一體化桌面人工智慧應用程式，旨在提升生產力，保護您的隱私，並提供無與倫比的靈活性。

桌面AI應用程式 Large Language Models (LLMs)

IndieFeel.com

9.3K

歌曲常常承載著深刻的訊息和情感，邀請聽眾探索其更深層的意義。詮釋歌曲背後的意義，不僅增強了我們對音樂的欣賞，也讓我們與藝術家的意圖及其表達的情感產生聯繫。在本指南中，我們將深入探討各種拆解歌詞和理解其內在故事的技巧。無論你是隨意的聽眾還是音樂愛好者，學習解讀歌曲意義都能豐富你的聆聽體驗，並促進與音樂藝術之間的更深連結。

歌曲 Other

SnapXam

339.3K

介紹人工智慧驅動的數學和物理輔導器：您終極的學習夥伴透過我們先進的人工智慧輔導平台，釋放您在數學和物理方面的潛能。這款設計用以提供個性化協助的人工智慧輔導器，會根據您的學習風格進行調整，幫助您掌握挑戰性的概念並在學業上取得優異成績。體驗量身定制的課程、即時反饋，及引人入勝的練習題，讓複雜主題變得易於理解。探索教育的未來，體驗這款改變您學習數學和物理方式的人工智慧輔導器！

數學解題工具 Homework Helper

typedesk

22.7K

Typedesk 是一款強大的通用應用程式，旨在自動化打字，提高各種平台之間的一致性。使用 Typedesk，輕鬆簡化您的工作流程，輕鬆提升生產力。

預設回覆應用程式 AI Product Description Generator

Find AI tools in YBX