Microsoft Lança o Phi-2: Um Modelo de Linguagem Compacto que Supera o Llama 2 e o Mistral 7B em Desempenho

O impulso dos desenvolvimentos em IA generativa está acelerando à medida que nos aproximamos do final de 2023, desafiando a desaceleração típica associada à temporada de festas de inverno.

Hoje, a Microsoft Research, a divisão de ponta da gigante da tecnologia, apresentou seu modelo de linguagem pequeno Phi-2 (SML). Esta inovadora IA de texto-para-texto é compacta o suficiente para operar em laptops e dispositivos móveis, conforme destacado em um post no X.

O Phi-2, equipado com 2,7 bilhões de parâmetros (conexões entre neurônios artificiais), oferece desempenho equivalente a modelos maiores, como o Llama 2-7B da Meta, que possui 7 bilhões de parâmetros, e o Mistral-7B, outro modelo do mesmo porte. Notavelmente, o Phi-2 também supera o novo modelo Gemini Nano 2 do Google, apesar deste conter 500 milhões de parâmetros a mais. Além disso, o Phi-2 gera respostas com menos toxicidade e viés em comparação ao Llama 2.

Em uma comparação direta, a Microsoft mencionou o controverso vídeo de demonstração do Google, no qual o próximo modelo Gemini Ultra supostamente resolveu problemas complexos de física e corrigiu erros de estudantes. Curiosamente, o Phi-2 também respondeu com precisão a esses desafios de física e forneceu as soluções corretas, apesar de ser significativamente menor que o Gemini Ultra.

Entretanto, existe uma limitação significativa: o Phi-2 está atualmente licenciado apenas para fins de pesquisa sob uma Licença Customizada da Microsoft Research, que proíbe explicitamente o uso comercial. Consequentemente, empresas que desejarem desenvolver produtos baseados neste modelo não poderão fazê-lo no momento.

Most people like

Find AI tools in YBX