A Microsoft anunciou o lançamento do Phi-3, um robusto modelo de linguagem com 3 bilhões de parâmetros, que oferece habilidades avançadas de raciocínio comparáveis a modelos maiores, mas a um custo significativamente mais baixo. Desenvolvido pela Microsoft Research, o Phi-3 estará disponível na plataforma Azure AI, permitindo que as empresas utilizem processamento de linguagem natural de ponta para diversas aplicações.
"O que importa é que temos um modelo compacto com capacidades que rivalizam com modelos muito maiores, aproximando-se do desempenho do GPT-3.5", afirmou Sébastien Bubeck, Vice-Presidente da Microsoft Generative AI. "O progresso que conseguimos ultrapassou as expectativas iniciais, pois ninguém previa o tamanho necessário para alcançar essas capacidades."
O Phi-3 representa o mais recente marco na exploração da Microsoft de modelos de linguagem compactos. Começando com o Phi-1 no ano passado, seguido pelo Phi-1.5 e Phi-2, a série Phi demonstrou desempenho excepcional em codificação, raciocínio de senso comum e benchmarks de linguagem natural, com modelos variando de 1 a 2 bilhões de parâmetros.
Soluções de IA Eficientes para Empresas
“À medida que os clientes testemunham o que é possível, eles buscam formas de inovar”, disse Eric Boyd, Vice-Presidente Corporativo da plataforma Azure AI. “Na Azure, estamos facilitando o desenvolvimento de aplicações de IA generativa que atendem às suas necessidades. Sempre ofereceremos os modelos mais avançados, ultrapassando os limites da inovação e disponibilizando opções de alta qualidade em todos os níveis de preço.”
Com o Phi-3, a Microsoft desenvolveu um modelo versátil de 3 bilhões de parâmetros que se assemelha às capacidades de modelos líderes como o GPT-3.5 da OpenAI, mas a uma fração do custo e adaptável para operar em hardware padrão e até smartphones. Esse avanço na eficiência de parâmetros desbloqueia oportunidades transformadoras de IA para empresas que antes eram muito caras para implementar.
Compromisso com uma IA Responsável
A Microsoft priorizou os princípios de IA Responsável no desenvolvimento do Phi-3. Os dados de treinamento do modelo foram rigorosamente analisados em busca de toxicidade e preconceitos, além de medidas adicionais de segurança. Essa abordagem cuidadosa permite que as empresas—especialmente as em setores regulamentados—utilizem com confiança os recursos avançados do Phi-3.
Do ponto de vista técnico, o Phi-3 opera no ONNX Runtime otimizado para GPUs NVIDIA, permitindo a implantação distribuída em várias GPUs ou máquinas para maximizar o rendimento. Sua arquitetura utiliza mecanismos de atenção eficientes e precisão numérica otimizada, oferecendo alto desempenho com um tamanho de modelo relativamente compacto.
Empoderando Empresas com IA Avançada em Linguagem Natural
“A vantagem dessa camada fundamental em um modelo menor é que as empresas podem ajustá-lo com seus dados para alcançar resultados excepcionais em domínios específicos”, explicou Bubeck. “Mesmo em áreas especializadas, a inteligência geral continua sendo crucial.”
A introdução do Phi-3—e sua integração na plataforma Azure AI—marca um avanço significativo em tornar as capacidades de grandes modelos de linguagem acessíveis e econômicas para empresas de todos os tamanhos. À medida que as organizações buscam operacionalizar a IA e explorar o valor dos dados não estruturados, modelos personalizados como o Phi-3 se mostrarão essenciais para realizar essa ambição.