Le 16 mai, Xiaomi a annoncé officiellement via son compte Weibo que son modèle de langage avancé, MiLM, a achevé son processus de备案 (enregistrement). Ce modèle sera progressivement intégré dans divers produits Xiaomi, notamment les voitures, les smartphones et les dispositifs de maison intelligente, et sera disponible prochainement pour un plus grand nombre d'utilisateurs.
Le modèle MiLM a attiré l'attention lors des évaluations de modèles de grande envergure C-Eval et CMMLU en août dernier, où il a obtenu la 10e place au classement général de C-Eval et s'est classé premier parmi les modèles aux paramètres similaires. Selon sa page de projet GitHub, MiLM-6B est un modèle de langage pré-entraîné à grande échelle développé par Xiaomi, avec un nombre de paramètres de 6,4 milliards.
Les données de C-Eval montrent que MiLM-6B présente une grande précision dans 20 disciplines STEM (Sciences, Technologie, Ingénierie et Mathématiques), y compris des domaines tels que la physique, la chimie et la biologie. Le modèle affiche également de bonnes performances dans les matières humaines, bien qu'il doive s'améliorer dans les disciplines nécessitant une "pensée abstraite", comme le droit, les mathématiques, la programmation et la théorie des probabilités.
Dans les évaluations des sciences sociales, MiLM-6B a obtenu une précision satisfaisante dans 8 des 10 matières, à l'exception de "l'Éducation et la Géographie". De plus, lors des évaluations dans les domaines des sciences humaines, le modèle a démontré des résultats encourageants dans les domaines de "l'Histoire et du Droit".