No dia 16 de agosto, ocorreu a Conferência Global de Tecnologia de Código Aberto (GOTC2024) em Xangai, organizada pela Open Source China e pelo Parque de Software Pudong. Zhang Qunhui, Especialista Chefe em Software de Armazenamento de Dados da Huawei, compartilhou insights sobre as aplicações práticas do ModelEngine em domínios de grandes modelos verticais.
Zhang descreveu o ModelEngine como a caixa de ferramentas abrangente de treinamento e inferência de IA da Huawei dentro de seu Data Center Stack (DCS). Este avançado conjunto de ferramentas é o primeiro do setor a utilizar uma estrutura de programação em streaming de IA, oferecendo uma solução completa para processamento de dados, geração de conhecimento, ajuste fino de modelos, implantação e desenvolvimento de aplicações de geração aumentada por recuperação (RAG). Ele proporciona aos engenheiros de dados, engenheiros de modelos e desenvolvedores de aplicações uma experiência de desenvolvimento de IA integrada.
Ele enfatizou que a caixa de ferramentas de código aberto baseada no ModelEngine permite o processamento de dados, utilização de modelos e suporte a aplicações com operadores de dados abertos, modelos convencionais e operadores de aplicação. A plataforma reduziu significativamente o tempo de geração de corpus de meses para apenas dias. Além disso, oferece aos desenvolvedores uma solução integrada para desenvolvimento, avaliação, otimização e implantação de aplicações de IA, facilitando a construção rápida de aplicações enquanto garante compatibilidade com ativos de IA existentes, como plugins LangChain e LlamaIndex.