Em 16 de maio, a Xiaomi anunciou oficialmente através de sua conta no Weibo que seu modelo de linguagem, MiLM, concluiu o processo de registro. Este modelo será integrado gradualmente em diversos produtos da Xiaomi, incluindo automóveis, smartphones e dispositivos de casa inteligente, e estará disponível para mais usuários em um futuro próximo.
O modelo MiLM chamou a atenção durante as avaliações de modelos C-Eval e CMMLU em agosto passado, onde ocupou a 10ª posição geral no C-Eval e alcançou o primeiro lugar entre modelos com parâmetros similares. Segundo sua página no GitHub, o MiLM-6B é um modelo de linguagem pré-treinado de grande escala desenvolvido pela Xiaomi, com 6,4 bilhões de parâmetros.
Os dados do C-Eval mostram que o MiLM-6B demonstra alta precisão em 20 disciplinas nas áreas de STEM (Ciência, Tecnologia, Engenharia e Matemática), incluindo física, química e biologia. O modelo também apresenta bom desempenho nas ciências humanas, embora necessite de melhorias em disciplinas que envolvem "pensamento abstrato", como direito, matemática, programação e teoria da probabilidade.
Nas avaliações das ciências sociais, o MiLM-6B alcançou precisão satisfatória em 8 de 10 disciplinas, exceto em "Educação e Geografia". Além disso, durante as avaliações nas ciências humanas, o modelo apresentou resultados elogiáveis nas áreas de "História e Direito".