OpenAI Invita a la Participación Pública para Recopilar Más Datos para Entrenar Sus Modelos de IA

OpenAI busca activamente datos específicos de dominio para mejorar sus modelos de IA, con el objetivo de lograr una comprensión más matizada de diversos temas y contextos. La empresa ha lanzado el programa de Alianzas de Datos de OpenAI, invitando a contribuciones públicas para recopilar conjuntos de datos, tanto públicos como privados, esenciales para entrenar modelos avanzados como GPT-4 y el recién lanzado GPT-4 Turbo.

OpenAI se enfoca especialmente en curar conjuntos de datos a gran escala que reflejen la sociedad humana de maneras no fácilmente disponibles en línea. La iniciativa abarca una amplia gama de medios, incluidos texto, imágenes, audio y video. La organización busca conjuntos de datos que expresen la intención humana, como escritos extensos o conversaciones profundas, en lugar de puntos de datos fragmentados.

Actualmente, OpenAI ha iniciado colaboraciones con diversas entidades para mejorar sus capacidades lingüísticas. Por ejemplo, trabaja con el Gobierno de Islandia y Miðeind ehf. para desarrollar un conjunto de datos especializado que mejore la competencia de GPT-4 en el idioma islandés. Además, una asociación con el Free Law Project tiene como objetivo enriquecer el entrenamiento de IA a través de su amplia colección de documentos legales, ayudando a democratizar el acceso al conocimiento jurídico.

El objetivo del programa de Alianzas de Datos es permitir que más organizaciones influyan en el desarrollo de tecnologías de IA, haciéndolas más relevantes y útiles según el contenido que aporten. Este esfuerzo colaborativo subraya la importancia de interactuar con conjuntos de datos diversos que reflejen la complejidad de las experiencias humanas y las necesidades sociales.

Sin embargo, OpenAI se compromete a seguir prácticas éticas en la recopilación de datos. La organización ha dejado claro que no pretende incluir información personal sensible o datos de terceros en sus conjuntos de datos. En su lugar, se centra en crear un conjunto de datos de código abierto que pueda ser utilizado por la comunidad de IA, junto con la posibilidad de preparar conjuntos de datos privados para aplicaciones especializadas.

Además de sus iniciativas de datos, el CEO de OpenAI, Sam Altman, anunció recientemente planes para colaborar con clientes corporativos en el desarrollo de modelos de IA personalizados. Aunque indicó que, inicialmente, estos servicios podrían no ser asequibles para muchas empresas, destacó el potencial para avances revolucionarios para aquellos dispuestos a invertir en estas soluciones personalizadas. Altman también mencionó un aumento del interés tras el anuncio de nuevos modelos y actualizaciones, lo que ha llevado a una mayor demanda y algo de volatilidad en sus plataformas.

En un desarrollo relacionado, OpenAI confirmó que ChatGPT había sufrido un ataque DDoS, pero se restauró a plena funcionalidad en dos días. Este incidente resalta la creciente atención y utilización de las tecnologías de IA, así como los desafíos que surgen con su rápido crecimiento e interés.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles