Deci dévoile une plateforme de développement IA innovante et le modèle compact Deci Nano.

En période plus tranquille pour OpenAI, son concurrent Anthropic a fait sensation avec le lancement de sa famille de modèles de langage Claude 3. Un autre acteur à surveiller dans le domaine de l'IA générative est la startup israélienne Deci, qui a récemment annoncé d'importantes mises à jour de ses produits.

Décidée à renforcer son impact, Deci a lancé à l’automne 2023 les modèles open-source DeciDiffusion et DeciLM 6B, des versions optimisées du Stable Diffusion 1.5 de Stability et du LLaMA 2 7B de Meta. Depuis, Deci a présenté DeciCoder, un modèle LLM pour la complétion de code, ainsi que DeciDiffusion 2.0, amélioré. Le dernier-né de l'entreprise, Deci-Nano, est un LLM plus petit et plus efficace, disponible uniquement via la plateforme de développement d'IA générative de Deci, destinée aux entreprises et aux développeurs.

Vers une Stratégie Commerciale ?

Il semble que Deci s'oriente vers une stratégie plus commerciale, à l'instar du partenariat entre Mistral et Microsoft, ce qui suscite des interrogations sur l'avenir de l'IA open-source. Rachel Salkin, VP marketing de Deci, a déclaré par e-mail :

« Nous restons engagés à soutenir la communauté open-source tout en reconnaissant la valeur des modèles fermés qui améliorent la précision et la rapidité, offrant ainsi une plus grande valeur à nos clients. »

Salkin a également souligné les récents modèles open-source publiés, tels que DeciLM-6B, DeciLM-7B et DeciCoder, qui continuent d'enregistrer des téléchargements significatifs, malgré la pause temporaire de leurs espaces de démonstration.

Performance à un Prix Compétitif

Si Deci choisit effectivement une voie commerciale, Deci-Nano constitue une première étape indicative. Ce modèle excelle dans la compréhension du langage et le raisonnement, atteignant 256 tokens en seulement 4,56 secondes sur des GPU NVIDIA A100.

Le blog de Deci insiste sur le fait que Deci-Nano surpasse des modèles tels que le 7B-Instruct de Mistral et le Gemma 7B de Google, tout en étant exceptionnellement abordable à 0,10 $ par million de tokens d'entrée, comparé aux 0,50 $ d’OpenAI GPT-3.5 Turbo et aux 0,25 $ de Claude 3 Haiku.

« Deci-Nano incarne notre approche axée sur la production, alliant qualité et rentabilité », a déclaré Yonatan Geifman, co-fondateur et PDG de Deci. Ce modèle à fenêtre de contexte de 8K a été développé grâce à la technologie AutoNAC de Deci, conçue pour optimiser l'efficacité des modèles en générant des versions plus petites reproduisant fidèlement les fonctionnalités des plus grands.

Du service d'analyse financière à la création de contenu, Deci-Nano vise à aider les entreprises à innover tout en maîtrisant efficacement leurs coûts.

Deci propose également des options de déploiement flexibles, offrant soit des instances sans serveurs pour une évolutivité maximale, soit des instances dédiées pour une meilleure confidentialité et personnalisation. Cette polyvalence permet aux entreprises d'adapter leurs solutions IA en fonction de leurs besoins évolutifs, sans compromettre la performance.

Lancement d’une Plateforme Complète

Bien que l'on se concentre beaucoup sur Deci-Nano, le lancement d'une plateforme complète d'IA générative représente une avancée majeure. Cette plateforme est décrite comme une « solution globale » adaptée aux besoins d'efficacité et de confidentialité des entreprises.

Qu'est-ce qu'elle inclut ? Selon Deci, les utilisateurs ont accès à des LLMs ajustables, à un moteur d'inférence et à une solution de gestion de cluster d'inférence IA. Deci-Nano est le premier modèle propriétaire disponible via cette plateforme, suivie de prévisions pour d'autres modèles à venir, certains open-source et d'autres fermés.

L'engin d'inférence permet aux utilisateurs de déployer Deci-Nano selon leurs besoins, que ce soit via l'API de Deci, sur leur cloud privé virtuel ou sur site. Pour les clients gérant leurs propres clouds privés, Deci fournira un modèle conteneurisé et des services d'inférence gérés dans leur cluster Kubernetes.

En outre, la plateforme d'IA générative offre des options de déploiement sur site pour les entreprises souhaitant garder leurs données en interne. Les clients recevront un conteneur virtuel contenant Deci-Nano et le kit de développement logiciel Infery de Deci, facilitant l'intégration dans leurs applications.

Les détails de tarification de la plateforme Deci Generative AI et de ses différentes offres n'ont pas encore été divulgués, mais des mises à jour seront fournies dès que des informations seront disponibles.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles