Mãe do TikTok Acusada de Usar a API da OpenAI para Desenvolver Modelos Competidores

A ByteDance, empresa-mãe do TikTok, está supostamente violando os termos de serviço da OpenAI ao usar sua tecnologia para criar modelos de linguagem concorrentes. Segundo o The Verge, a ByteDance está aproveitando a API da OpenAI para coletar dados para o desenvolvimento de seu próprio modelo fundamental, atualmente chamado de Projeto Seed. Com um histórico de inovação em IA generativa, os pesquisadores da ByteDance concentraram-se em modelos sofisticados de geração em 3D.

As políticas da OpenAI proíbem explicitamente o uso de saídas de modelos como o GPT-4 para criar sistemas rivais. No entanto, a ByteDance estaria obtendo acesso à tecnologia da OpenAI por meio da Microsoft — um fornecedor que possui restrições similares — e reportedly tem maximizando consistentemente o uso de sua API. Informações indicam que a API tem sido fundamental nas fases de desenvolvimento do Projeto Seed, abrangendo tanto o treinamento quanto a avaliação do modelo.

De acordo com informações obtidas pelo The Verge, discussões de funcionários na Lark, a plataforma de mensagens interna da ByteDance, revelaram esforços para "maquiar" evidências do suposto uso indevido da tecnologia da OpenAI. Os desenvolvedores da empresa, principalmente localizados na China, estariam disfarçando o uso da API da OpenAI por meio de técnicas de desensibilização de dados, geralmente utilizadas para proteger informações sensíveis de negócios ou pessoais.

Em resposta a essas alegações, a OpenAI confirmou que o acesso da ByteDance à sua conta do ChatGPT foi suspenso enquanto uma investigação está em andamento. Um porta-voz da ByteDance enfatizou o compromisso da empresa em seguir as diretrizes de uso da OpenAI. Ele declarou: "Utilizamos o GPT para aprimorar produtos e recursos em mercados fora da China, enquanto nosso modelo próprio alimenta o Doubao, exclusivo para a China."

O Doubao é o sistema de IA conversacional da ByteDance, facilitando interações dos usuários por meio de imagens e texto. O porta-voz afirmou que um grupo restrito de engenheiros havia utilizado a API da OpenAI para "um modelo experimental interno que nunca foi lançado". Essa prática foi supostamente interrompida em abril, com novos protocolos internos estabelecidos para garantir que os textos gerados por modelos GPT não fossem utilizados nos conjuntos de dados de treinamento dos modelos proprietários da ByteDance.

Além disso, a ByteDance indicou que sua equipe de engenharia agora utiliza a API do GPT de forma restrita durante os processos de avaliação e testes, como benchmarking de pontuações. A empresa implementou medidas para garantir a conformidade, incluindo a realização de amostragem em bateladas e a comparação da similaridade de seus dados rotulados com as saídas da OpenAI, mitigando o risco de uso inadequado por anotadores de dados.

Com o auge da popularidade do ChatGPT, grandes empresas de tecnologia chinesas, incluindo ByteDance, Baidu e Alibaba, têm corrido para desenvolver seus próprios modelos de linguagem de grande porte. Recentemente, a China revelou um novo supercomputador projetado para fortalecer os esforços locais na capacitação de modelos de IA, destacando ainda mais a competitividade no setor de inteligência artificial.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles