Writer, ein im Jahr 2020 in San Francisco gegründetes Startup, hat im September 2023 100 Millionen Dollar gesammelt, um seine proprietären großen Sprachmodelle (LLMs) für Unternehmensanwendungen zu erweitern. Obwohl Writer nicht so bekannt ist wie Giganten wie OpenAI, Anthropic oder Meta, etabliert es sich mit seinen hauseigenen Modellen, die zusammen Palmyra genannt werden. Renommierte Unternehmen wie Accenture, Vanguard, HubSpot und Pinterest nutzen die Kreativitäts- und Produktivitätsplattform von Writer, die von diesen Modellen angetrieben wird.
Kürzlich stellte das Stanford HAI Center for Research on Foundation Models eine neue Benchmark-Metrik namens HELM Lite vor, die ein kontextuelles Lernen ermöglicht. Damit können LLMs Aufgaben von einer kleinen Menge an Beispielen lernen, die während der Inferenz bereitgestellt werden. Während GPT-4 diese Benchmark anführte, schnitten die Modelle Palmyra X V2 und X V3 "unerwartet" gut ab und erzielten hohe Platzierungen, trotz ihrer geringeren Größe, so Percy Liang, Direktor des Stanford-Zentrums.
Im Bereich der maschinellen Übersetzung hat Palmyra hervorragend abgeschnitten und eine Spitzenplatzierung erreicht. CEO May Habib hob diesen Erfolg in einem LinkedIn-Beitrag hervor und erklärte: „Palmyra X übertrifft klassische Benchmarks und belegt die Gesamtführung im MMLU sowie beim neuen Übersetzungstest.“
Habib betonte die wirtschaftlichen Herausforderungen, vor denen Unternehmen bei der Implementierung größerer Modelle wie GPT-4 stehen, das auf 1,2 Billionen Tokens trainiert wurde. Sie stellte fest: „Die Anwendungsfälle von Generativer KI im Jahr 2024 müssen wirtschaftlich tragfähig sein“, und erklärte, dass Unternehmen oft mit hohen Betriebskosten und sich ändernden Eingaben aufgrund der Modellverdichtung kämpfen. Sie glaubt, dass das Benchmarking von Stanford HAI die realen Bedürfnisse von Unternehmen genauer widerspiegelt als andere Plattformen wie Hugging Face.
Writer richtete sich zunächst an Marketingteams und wurde von Habib und Waseem AlShikh, der zuvor Qordoba, ein Unternehmen für NLP und maschinelle Übersetzung, leitete, mitgegründet. Anfang 2023 führte Writer die Palmyra-Serie ein, einschließlich Modelle mit 128 Millionen bis 20 Milliarden Parametern, und startete den Knowledge Graph, um Unternehmen zu helfen, Geschäftsdaten mit Palmyra zu integrieren und Modelle selbst zu hosten.
„Wir bieten eine umfassende Lösung, die das Modell mit einem integrierten Retrieval-Augmented Generation (RAG)-System kombiniert“, sagte Habib. Diese Innovation behebt die Ineffizienzen, die mit dem Senden von Daten zu Embedding-Modellen und dem Empfang von Ergebnissen verbunden sind.
Habib spricht sich für kleinere Modelle aus, die mit kuratierten Trainingsdaten kombiniert werden, auch im Hinblick auf Aussagen von Experten, die behaupten, dass größere Generalistenmodelle spezialisierte übertreffen. Sie wies darauf hin, dass die HELM Lite Rangliste zeigte, dass medizinische LLMs GPT-4 übertrafen, und betonte: „Im Hinblick auf Inferenz und Kosten profitieren Unternehmen von spezialisierten Modellen, die leichter zu verwalten und wirtschaftlicher sind.“