A OpenAI, líder em pesquisa em inteligência artificial, apresentou uma nova geração de modelos de embedding que transformam texto em representações numéricas adequadas para diversas tarefas de machine learning. Juntamente com isso, a empresa lançou versões aprimoradas dos modelos GPT-4 Turbo e GPT-3.5 Turbo, modelos de moderação atualizados, novas ferramentas de gerenciamento de uso da API e uma redução de 25% no preço do modelo GPT-3.5 Turbo.
Os embeddings são sequências numéricas que representam conceitos em conteúdos como linguagem natural ou código. Eles permitem que os modelos de machine learning compreendam eficientemente as relações dentro dos dados, facilitando tarefas como agrupamento e recuperação. Os embeddings são a base de aplicações como recuperação de conhecimento no ChatGPT e na Assistants API, além de diversas ferramentas de geração aumentada por recuperação (RAG) para desenvolvedores.
Os novos modelos de embedding da OpenAI, text-embedding-3-small e text-embedding-3-large, oferecem desempenho e custo mais acessíveis em comparação ao modelo anterior, text-embedding-ada-002. Esses modelos geram embeddings com até 3072 dimensões, capturando mais informações semânticas para melhorar a precisão de tarefas subsequentes.
Notavelmente, a pontuação média em um benchmark amplamente utilizado para recuperação multilíngue (MIRACL) aumentou de 31,4% para 54,9% com os novos modelos, enquanto a pontuação para tarefas em inglês (MTEB) subiu de 61,0% para 64,6%. O preço do text-embedding-3-small foi reduzido em cinco vezes em relação ao seu antecessor, tornando-o mais econômico para desenvolvedores.
Adicionalmente, a OpenAI aprimorou seus modelos GPT-4 Turbo e GPT-3.5 Turbo, que agora entendem e geram tanto linguagem natural quanto código. As versões mais recentes oferecem melhor interpretação de instruções, capacidades no modo JSON, saídas mais reproduzíveis e suporte para chamadas de função em paralelo. Uma nova versão com contexto de 16k do GPT-3.5 Turbo também foi introduzida, permitindo o processamento de entradas e saídas maiores em comparação à versão padrão de 4k.
O modelo de moderação de texto também foi atualizado para detectar melhor textos potencialmente sensíveis ou inseguros. Esta nova versão pode lidar com uma gama maior de idiomas e domínios, fornecendo explicações para suas classificações.
Os desenvolvedores agora podem gerenciar chaves de API de forma mais eficaz, criando várias chaves com diferentes permissões e escopos, além de monitorar o uso da API e a cobrança no OpenAI Dashboard. A esperada redução de 25% no preço do modelo GPT-3.5 Turbo visa aumentar a acessibilidade, incentivando mais desenvolvedores a aproveitar esse recurso em suas aplicações.
Essas atualizações refletem o compromisso da OpenAI em aprimorar continuamente seus modelos e serviços para melhor atender desenvolvedores e clientes. A empresa convida avaliações de desenvolvedores para ajudar a refinar os modelos para diversos casos de uso e promete melhorias, recursos e ferramentas contínuas no futuro.