OpenAI Lança o GPT-4 Turbo com Acesso Geral à API de Visão

À medida que os desenvolvedores empresariais e líderes de negócios reconhecem, a interface de programação de aplicativos (API) é fundamental para o desenvolvimento moderno de software, permitindo que aplicativos de terceiros se conectem de forma integrada às plataformas tecnológicas. Recentemente, a OpenAI fez melhorias significativas em sua API para o poderoso modelo de linguagem GPT-4 Turbo.

A empresa anunciou em suas contas no X que o modelo GPT-4 Turbo com Visão está agora "disponível para uso geral" por meio de sua API. As capacidades de visão foram introduzidas junto com o envio de áudios em setembro de 2023, enquanto o GPT-4 Turbo foi revelado na conferência de desenvolvedores da OpenAI em novembro. Esta versão promete processamento mais rápido, janelas de contexto de entrada maiores (até 128.000 tokens – aproximadamente o equivalente a um livro de 300 páginas) e uso econômico.

Os desenvolvedores podem agora utilizar os recursos de reconhecimento e análise de visão do modelo por meio de formato JSON e chamadas de função, permitindo a automação de diversas ações em aplicativos conectados — como enviar e-mails, postar online ou realizar compras. A OpenAI enfatiza a importância de implementar fluxos de confirmação do usuário antes de executar ações que impactem seus ambientes.

Um porta-voz da OpenAI afirmou que essas melhorias agilizam os fluxos de trabalho dos desenvolvedores, que anteriormente precisavam usar modelos distintos para texto e imagens. Agora, uma única chamada de API permite uma análise e raciocínio de imagens de forma fluida.

A OpenAI destaca vários clientes que estão aproveitando o GPT-4 Turbo com Visão, incluindo a Cognition, uma startup que utiliza o modelo para gerar código de forma autônoma, e a Healthify, um aplicativo de saúde e fitness que oferece análise nutricional e recomendações de refeições a partir de fotos enviadas pelos usuários. Além disso, a startup britânica TLDraw usa o GPT-4 Turbo com Visão para aprimorar seu quadro branco virtual, transformando os desenhos dos usuários em sites funcionais.

Embora o GPT-4 Turbo tenha enfrentado concorrência de modelos mais novos, como o Claude 3 Opus da Anthropic, Command R+ da Cohere e Gemini Advanced do Google em testes de benchmarks, o lançamento do GPT-4 Turbo com Visão visa atrair mais clientes empresariais e desenvolvedores. Essa movimentação posiciona os modelos da OpenAI como uma escolha atraente, à medida que a indústria aguarda o lançamento de seu próximo modelo de linguagem.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles