OpenAI invite le public à participer afin de collecter davantage de données pour entraîner ses modèles d'IA.

OpenAI recherche activement des données spécifiques à des domaines uniques pour améliorer ses modèles d'IA, visant une compréhension plus nuancée de divers sujets et contextes. L'entreprise a lancé le programme des Partenariats de Données d'OpenAI, invitant des contributions publiques pour rassembler des ensembles de données, tant publiques que privées, essentiels à l'entraînement de modèles avancés comme GPT-4 et le nouveau GPT-4 Turbo.

OpenAI se concentre particulièrement sur la constitution d'ensembles de données à grande échelle qui reflètent la société humaine de manière difficilement accessible en ligne. L'initiative englobe une vaste gamme de médias, y compris du texte, des images, de l'audio et de la vidéo. L'organisation recherche des ensembles de données qui expriment l'intention humaine—écriture longue ou conversations complètes—plutôt que des points de données fragmentés.

Actuellement, OpenAI a engagé des collaborations avec diverses entités pour améliorer les capacités linguistiques. Par exemple, elle travaille avec le gouvernement islandais et Miðeind ehf. pour développer un ensemble de données spécialisé visant à améliorer la maîtrise de la langue islandaise par GPT-4. De plus, un partenariat avec le Free Law Project vise à enrichir l'entraînement de l'IA grâce à sa vaste collection de documents juridiques, contribuant ainsi à démocratiser l'accès au savoir juridique.

L'objectif du programme des Partenariats de Données est de permettre à davantage d'organisations d'influencer le développement des technologies IA, les rendant ainsi plus pertinentes et utiles selon le contenu qu'elles fournissent. Cet effort collaboratif souligne l'importance de s'engager avec des ensembles de données diversifiés qui reflètent la complexité des expériences humaines et des besoins sociétaux.

Cependant, OpenAI s'engage à des pratiques éthiques en matière de collecte de données. L'organisation précise qu'elle n'entend pas inclure d'informations personnelles sensibles ou de données appartenant à des tiers dans ses ensembles de données. L'accent est mis sur la création d'un ensemble de données en source ouverte pouvant être utilisé par la communauté IA au sens large, tout en préparant éventuellement des ensembles de données privés pour des applications spécialisées.

En plus de ses initiatives de données, le PDG d'OpenAI, Sam Altman, a récemment annoncé des plans de collaboration avec des clients corporatifs pour développer des modèles d'IA personnalisés. Bien qu'il ait indiqué que ces services pourraient initialement ne pas être abordables pour de nombreuses entreprises, il a souligné le potentiel de percées révolutionnaires pour celles prêtes à investir dans ces solutions sur mesure. Altman a également noté une augmentation de l'intérêt suite à l'annonce de nouveaux modèles et mises à jour, ce qui a entraîné une demande accrue et une certaine volatilité des services sur ses plateformes.

Dans un développement connexe, OpenAI a confirmé que ChatGPT avait subi une attaque DDoS, mais qu'il avait été restauré à pleine fonctionnalité en deux jours. Cet incident souligne l'attention croissante et l'utilisation des technologies IA, ainsi que les défis qui accompagnent une telle croissance rapide et un tel intérêt.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles