OpenAI sucht aktiv nach einzigartigen, domänenspezifischen Daten, um seine KI-Modelle zu verbessern und ein differenzierteres Verständnis verschiedener Themen und Kontexte zu erlangen. Im Rahmen des OpenAI Data Partnerships Programms werden öffentliche Beiträge eingeladen, um sowohl öffentliche als auch private Datensätze zu sammeln, die für das Training fortschrittlicher Modelle wie GPT-4 und das neu lancierte GPT-4 Turbo von entscheidender Bedeutung sind.
Der Fokus liegt auf der Kuratierung groß angelegter Datensätze, die die menschliche Gesellschaft auf Weisen widerspiegeln, die online nicht leicht verfügbar sind. Die Initiative umfasst eine Vielzahl von Medien, darunter Text, Bilder, Audio und Video. OpenAI sucht gezielt Datensätze, die menschliche Intentionen darstellen – wie ausführliche Texte oder umfassende Gespräche – anstelle von fragmentierten Datenpunkten.
Derzeit hat OpenAI Kooperationen mit verschiedenen Partnern gestartet, um die Sprachfähigkeiten zu verbessern. So arbeitet das Unternehmen mit der isländischen Regierung und Miðeind ehf. zusammen, um einen spezialisierten Datensatz zu entwickeln, der die Kompetenz von GPT-4 in der isländischen Sprache steigern soll. Darüber hinaus soll eine Partnerschaft mit dem Free Law Project die KI-Training durch eine umfangreiche Sammlung juristischer Dokumente bereichern und den Zugang zu rechtlichem Wissen demokratisieren.
Das Ziel des Data Partnerships Programms besteht darin, mehr Organisationen die Möglichkeit zu geben, die Entwicklung von KI-Technologien zu beeinflussen, um diese relevanter und nützlicher zu gestalten, basierend auf den bereitgestellten Inhalten. Diese kollaborative Anstrengung betont die Bedeutung, mit vielfältigen Datensätzen zu arbeiten, die die Komplexität menschlicher Erfahrungen und gesellschaftlicher Bedürfnisse widerspiegeln.
OpenAI hat sich jedoch zu ethischen Praktiken in der Datensammlung verpflichtet. Das Unternehmen hat klar kommuniziert, dass es keine sensiblen persönlichen Informationen oder Daten Dritter in seine Datensätze aufnehmen möchte. Stattdessen liegt der Fokus auf der Erstellung eines Open-Source-Datensatzes, der von der breiten KI-Community genutzt werden kann, sowie der potenziellen Vorbereitung privater Datensätze für spezialisierte Anwendungen.
Neben den Dateninitiativen kündigte Sam Altman, CEO von OpenAI, kürzlich Pläne an, mit Firmenkunden zusammenzuarbeiten, um maßgeschneiderte KI-Modelle zu entwickeln. Zwar wies er darauf hin, dass diese Dienstleistungen anfangs für viele Unternehmen möglicherweise nicht erschwinglich seien, betonte jedoch das Potenzial für bahnbrechende Fortschritte für diejenigen, die bereit sind, in diese individuellen Lösungen zu investieren. Altman stellte auch einen Anstieg des Interesses nach der Ankündigung neuer Modelle und Updates fest, was zu einer höheren Nachfrage und gelegentlichen Instabilitäten auf den Plattformen führte.
In einer verwandten Entwicklung bestätigte OpenAI, dass ChatGPT einen DDoS-Angriff erlitten hatte, jedoch innerhalb von zwei Tagen wieder vollständig funktionsfähig war. Dieser Vorfall unterstreicht die zunehmende Aufmerksamkeit und Nutzung von KI-Technologien sowie die Herausforderungen, die mit dem rasanten Wachstum und Interesse einhergehen.