A OpenAI está ativamente buscando dados únicos e específicos para aprimorar seus modelos de IA, com o objetivo de uma compreensão mais profunda de diversos temas e contextos. A empresa lançou o programa OpenAI Data Partnerships, convidando contribuições do público para reunir conjuntos de dados públicos e privados essenciais para treinar modelos avançados como o GPT-4 e o recém-lançado GPT-4 Turbo.
O foco da OpenAI é especialmente na curadoria de conjuntos de dados em larga escala que representem a sociedade humana de maneiras que não estão facilmente disponíveis online. A iniciativa abrange uma ampla gama de mídias, incluindo texto, imagens, áudio e vídeo. A organização busca conjuntos de dados que expressem a intenção humana—como redações longas ou conversas abrangentes—em vez de dados fragmentados.
Atualmente, a OpenAI iniciou colaborações com diversas entidades para melhorar suas capacidades linguísticas. Por exemplo, está trabalhando com o governo da Islândia e a Miðeind ehf. para desenvolver um conjunto de dados especializado com o objetivo de aprimorar a proficiência do GPT-4 na língua islandesa. Além disso, uma parceria com o Free Law Project visa enriquecer o treinamento da IA por meio de sua extensa coleção de documentos legais, ajudando a democratizar o acesso ao conhecimento jurídico.
O objetivo do programa Data Partnerships é capacitar mais organizações a influenciar o desenvolvimento das tecnologias de IA, tornando-as mais relevantes e úteis com base no conteúdo que contribuem. Este esforço colaborativo enfatiza a importância de interagir com conjuntos de dados diversos que reflitam a complexidade das experiências humanas e das necessidades sociais.
No entanto, a OpenAI está comprometida com práticas éticas na coleta de dados. A organização deixou claro que não pretende incluir informações pessoais sensíveis ou dados pertencentes a terceiros em seus conjuntos de dados. O foco está em criar um conjunto de dados de código aberto que possa ser utilizado pela comunidade de IA em geral, além da preparação potencial de conjuntos de dados privados para aplicações especializadas.
Além de suas iniciativas de dados, o CEO da OpenAI, Sam Altman, anunciou recentemente planos para colaborar com clientes corporativos no desenvolvimento de modelos de IA personalizados. Embora tenha indicado que, inicialmente, esses serviços podem não ser acessíveis para muitas empresas, ele destacou o potencial de avanços inovadores para aqueles dispostos a investir nessas soluções personalizadas. Altman também observou um aumento no interesse após o anúncio de novos modelos e atualizações, o que resultou em maior demanda e certa volatilidade nos serviços em suas plataformas.
Em um desenvolvimento relacionado, a OpenAI confirmou que o ChatGPT sofreu um ataque DDoS, mas foi restaurado à plena funcionalidade em dois dias. Esse incidente sublinha a crescente atenção e utilização das tecnologias de IA, bem como os desafios que acompanham esse rápido crescimento e interesse.