DeepSeek Coder de Chine : le premier modèle de codage open-source qui surpasse GPT-4 Turbo

Home Actualités IA DeepSeek Coder de Chine : le premier modèle de codage open-source qui surpasse GPT-4 Turbo

La startup chinoise DeepSeek, reconnue pour avoir développé un concurrent de ChatGPT entraîné sur 2 trillions de tokens en anglais et en chinois, a lancé DeepSeek Coder V2, un modèle open-source de mélange d'experts (MoE) pour la génération de code.

S'appuyant sur le succès de DeepSeek-V2, lancé le mois dernier, DeepSeek Coder V2 excelle dans les tâches de codage et de mathématiques, prenant en charge plus de 300 langages de programmation. Il surpasse les modèles fermés leaders comme GPT-4 Turbo, Claude 3 Opus et Gemini 1.5 Pro, marquant une avancée significative en tant que premier modèle ouvert à atteindre ce niveau de performance, surpassant Llama 3-70B et d'autres dans sa catégorie.

Fondée en 2022, DeepSeek vise à "percer le mystère de l'AGI par la curiosité." En un an, l'entreprise a rendu open-source plusieurs modèles, y compris la famille DeepSeek Coder. Le modèle original DeepSeek Coder, avec 33 milliards de paramètres, a bien performé pour la complétion et l'injection de code à niveau projet, mais ne prenait en charge que 86 langages de programmation et avait une fenêtre de contexte de 16K. La nouvelle version V2 élargit le support des langages à 338 et augmente la fenêtre de contexte à 128K, lui permettant de relever des défis de codage plus complexes.

Dans des benchmarks tels que MBPP+, HumanEval et Aider, conçus pour évaluer les capacités de génération, d'édition de code et de résolution de problèmes, DeepSeek Coder V2 a obtenu des scores de 76,2, 90,2 et 73,7 respectivement, dépassant de nombreux modèles ouverts et fermés, y compris GPT-4 Turbo, Claude 3 Opus et Llama-3 70B. Il a également démontré des résultats solides dans les benchmarks mathématiques (MATH et GSM8K).

Le seul modèle à surpasser DeepSeek Coder V2 sur plusieurs benchmarks était GPT-4o, avec des scores légèrement plus élevés dans HumanEval, LiveCode Bench, MATH et GSM8K. DeepSeek a tiré ces avancées de DeepSeek V2, qui utilise un cadre de mélange d'experts, pré-entraîné sur un vaste ensemble de données de 6 trillions de tokens axé sur le code et les mathématiques, principalement extrait de GitHub et de CommonCrawl.

Avec des options de 16B et 236B de paramètres, le modèle active uniquement 2,4B et 21B de paramètres d'experts pour des tâches spécifiques tout en optimisant l'efficacité informatique.

Outre ses capacités de codage, DeepSeek Coder V2 montre de solides compétences en raisonnement général et en compréhension du langage. Par exemple, il a obtenu un score de 79,2 au benchmark MMLU, surpassant d'autres modèles spécifiques au code tout en se rapprochant de Llama-3 70B. GPT-4o et Claude 3 Opus dominent la catégorie MMLU avec des scores de 88,7 et 88,6 respectivement.

Cette évolution indique que les modèles de codage open-source progressent dans un éventail d'applications plus large, rivalisant de plus en plus avec les technologies fermées de premier plan.

DeepSeek Coder V2 est disponible sous la licence MIT, permettant un usage tant pour la recherche que commercial. Les utilisateurs peuvent télécharger les modèles 16B et 236B en configurations instruct et base via Hugging Face, ou y accéder par API sur la plateforme DeepSeek avec un modèle de paiement à l'utilisation.

Pour explorer ses capacités, les utilisateurs peuvent interagir avec DeepSeek Coder V2 à travers un chatbot sur la plateforme de l'entreprise.

Augie Studio : Révolutionner la création de vidéos par IA pour les marketers et les entreprises comme Canva.

Le co-fondateur et CTO de Runway annonce la sortie de la version alpha Gen-3 dans quelques jours, exclusivement pour les abonnés payants.

Most people like

White Label SEO, PPC, and Web Design Reseller Platform

47K

Les agences ont l'opportunité de rebranding et de revendre des services de SEO, de PPC et de design web sous leur propre nom, leur permettant ainsi d'élargir leur gamme de services et d'améliorer leur présence sur le marché.

SEO en marque blanche AI Advertising Assistant

Lingolette

45.3K

Dans le monde rapide d'aujourd'hui, une communication efficace est essentielle, rendant la fluidité orale une compétence cruciale pour les apprenants. Une machine d'enseignement des langues conçue spécifiquement pour améliorer la fluidité orale peut révolutionner la manière dont les individus pratiquent et perfectionnent leurs capacités orales. En alliant technologie avancée et techniques d'apprentissage personnalisées, cet outil innovant aide les utilisateurs à gagner en confiance et en maîtrise de leur langue parlée, devenant ainsi un atout inestimable pour les enseignants et les apprenants. Découvrez comment cette machine de pointe peut transformer votre parcours linguistique et élever vos compétences conversationnelles à de nouveaux sommets.

apprentissage des langues AI Chatbot

SHIFT AI

161.1K

Construisons un système qui regroupe des informations de haute qualité et des talents exceptionnels, renforçant ainsi notre position de nation leader dans l'utilisation de l'IA. Dans le paysage technologique de l'IA en rapide évolution d'aujourd'hui, il est essentiel de sécuriser des professionnels possédant des connaissances et des compétences spécialisées. Cette initiative favorisera l'utilisation de l'IA, améliorant ainsi la compétitivité globale des industries.

IA Other

AcademyOcean

259.9K

Débloquez le potentiel de la technologie IA pour créer des cours captivants Dans le paysage numérique d'aujourd'hui, l'intégration de la technologie IA dans la conception de cours révolutionne notre façon d'éduquer. En exploitant la puissance de l'intelligence artificielle, les éducateurs peuvent créer des expériences d'apprentissage personnalisées, interactives et efficaces qui répondent aux besoins uniques de chaque étudiant. Cette approche innovante améliore non seulement l'engagement, mais simplifie également le développement des cours. Découvrez comment vous pouvez tirer parti des outils IA pour créer des cours dynamiques qui captivent les apprenants et élèvent votre stratégie pédagogique.

IA AI Education Assistant

Find AI tools in YBX