Silo AI startet Poro: Ein neues Open-Source-Sprachmodell, das speziell für Europa entwickelt wurde.

Home KI-Nachrichten Silo AI startet Poro: Ein neues Open-Source-Sprachmodell, das speziell für Europa entwickelt wurde.

Updated on November 12 2023

Das in Helsinki ansässige KI-Startup Silo AI sorgt diese Woche mit der Einführung von Poro für Aufsehen, einem Open-Source- großen Sprachmodell (LLM), das sich auf die Verbesserung der mehrsprachigen KI-Fähigkeiten für europäische Sprachen konzentriert.

Poro ist das erste Modell einer Reihe von Open-Source-Modellen, die alle 24 offiziellen Sprachen der Europäischen Union unterstützen sollen. Entwickelt von SiloGen, der generativen KI-Abteilung von Silo AI, in Zusammenarbeit mit der Forschungsgruppe TurkuNLP der Universität Turku, wird Poro die Sprachverarbeitung auf dem gesamten Kontinent revolutionieren.

„Es geht um digitale Souveränität“, erklärte Peter Sarlin, CEO von Silo AI. „Wir möchten Modelle, die europäische Werte, Kultur und Sprachen verkörpern. Unser Ziel ist es, europäischen Unternehmen – und jeder Organisation – die Erstellung proprietärer Modelle zu ermöglichen, die ihren Wert innerhalb Europas bewahren.“

Das Poro 34B Modell mit 34,2 Milliarden Parametern hat seinen Namen vom finnischen Wort für „Rentier“. Es nutzt eine BLOOM-Transformer-Architektur mit ALiBi-Embedding und wurde auf einem diversifizierten Datensatz von 21 Billionen mehrsprachigen Tokens trainiert, einschließlich Englisch, Finnisch und Programmiersprachen wie Python und Java.

Poro wird auf LUMI, dem leistungsstärksten Supercomputer Europas in Kajaani, Finnland, trainiert, der über 512 AMD Instinct MI250X GPUs mit beeindruckenden 74 Petaflops Rechenleistung verfügt.

Sarlin betonte, dass Poro eine wichtige Herausforderung angeht: das Training effektiver natürlicher Sprachmodelle für ressourcenärmere europäische Sprachen wie Finnisch. Das Modell verwendet eine sprachübergreifende Trainingsstrategie, die auf Daten aus ressourcenreicheren Sprachen wie Englisch basiert.

Poro ist das zweite bedeutende Open-Source-LLM aus Europa, nach dem hochfinanzierten Mistral 7B des französischen Startups Mistral AI. Seine Einführung unterstreicht den wachsenden Einfluss Europas im sich rasch entwickelnden Bereich der generativen KI und signalisiert einen zunehmenden Wettbewerb zwischen verschiedenen KI-Forschungs- und Entwicklungseinrichtungen.

Transparente Forschung mit Poro

SiloGen verpflichtet sich zur Transparenz durch das Poro Research Checkpoints-Programm, das den Trainingsprozess des Modells dokumentiert. „Wir werden während des Trainingsprozesses Checkpoints veröffentlichen, was ein relativ neuer Ansatz ist“, erklärte Sarlin. „Solche Transparenz im Modelltraining ist ungewöhnlich.“

Der erste Checkpoint von Poro 34B erfasst die ersten 30 % des Trainings. Erste Benchmarks zeigen, dass Poro in dieser Phase bereits Ergebnisse auf dem neuesten Stand der Technik erzielt. In der FIN-bench-Bewertung für Finnisch übertrifft Poro spezialisierte einsprachige finnische Modelle wie FinGPT.

„Das Modell hat bereits bei nur 30 % des Trainings eine überlegene Leistung für ressourcenärmere Sprachen gezeigt“, bemerkte Sarlin. Indem es gemeinsame Muster über verwandte Sprachen hinweg identifiziert, erzielt Poro hervorragende Ergebnisse, selbst wenn die Trainingsdaten begrenzt sind.

Beeindruckend ist, dass Poro's mehrsprachige Fähigkeiten seine Leistung in Englisch nicht beeinträchtigen. Tests zeigen, dass es bestehende Modelle in finnischen Benchmarks übertrifft und auf dem Weg ist, die Leistung im Englischen zu erreichen oder zu übertreffen.

Eine Open-Source-Alternative zu Big Tech

Sarlin setzt sich für Open-Source-Modelle wie Poro als Zukunft der KI ein, die eine transparente und ethische Alternative zu proprietären Modellen der Technologieriesen bieten. „Ich glaube, dass wir viele Open-Source-Alternativen sehen werden“, sagte er. „Die sicherste Zukunft ist eine, die im Open-Source-Bereich verwurzelt ist, mit klarer Sichtbarkeit hinsichtlich der Modellerstellung und -architektur.“

Er fügte hinzu, dass erhebliche Anstrengungen unternommen wurden, um sicherzustellen, dass sowohl die Daten als auch das Modell von Anfang an den regulatorischen Standards entsprechen. Silo AI plant, während des Trainingsprozesses regelmäßig Poro-Checkpoints zu veröffentlichen, mit dem Ziel, eine umfassende Familie von Open-Source-Modellen für alle europäischen Sprachen zu etablieren.

Partnerschaft mit der Universität Turku

Die Entwicklung von Poro spiegelt eine fruchtbare Partnerschaft zwischen Silo AI und der Universität Turku wider, wo Forscher von TurkuNLP Open-Source-Ressourcen für die finnische Sprache entwickelt haben. „Meine Forschungsgruppe und mehrere Professoren haben sich zusammengeschlossen, um das Unternehmen mit Umsatzfinanzierungen zu skalieren“, teilte Sarlin mit. „Mit über 300 Mitarbeitern, von denen die meisten Doktortitel in KI-bezogenen Bereichen haben, unterscheiden wir uns erheblich von vielen anderen in der Branche.“

Diese Zusammenarbeit vereint die praktische KI-Expertise von Silo AI mit der Führungsrolle der Universität im Bereich mehrsprachige Modellforschung und zeigt ein Modell für effektive Zusammenarbeit zwischen Industrie und Wissenschaft zur Verbesserung der KI-Fähigkeiten für ressourcenärmere europäische Sprachen.

Ist Europa bereit, in der Open-Source-KI zu führen?

Die Einführung von Poro markiert den Beginn einer neuen Phase offener Zusammenarbeit und Transparenz in der Verarbeitung natürlicher Sprache. Initiativen wie die Poro Research Checkpoints bieten Einblicke und Ressourcen, die zuvor von großen Technologiefirmen monopolisiert wurden.

„Wir arbeiten mit Kunden wie Allianz, Rolls Royce, Honda und Philips zusammen und haben von großen Unternehmen Bedenken hinsichtlich zukünftiger Vorschriften und der Modelle gehört, die sie nutzen können“, sagte Sarlin.

Wenn Poro sein Potenzial ausschöpft, könnte es den Zugang zu leistungsstarken mehrsprachigen Modellen demokratisieren und Europa eine einheimische Alternative zu US-Technologieriesen anbieten. Es ist zwar noch früh, aber Poro stellt einen bedeutenden Schritt zur Schaffung eines zugänglichen und offenen Sprach-KI-Systems dar, das aus proprietären Silos in den öffentlichen Raum überführt wird.

Meta-Ingenieur: Nur zwei Kernkraftwerke nötig, um KI-Inferenz im Jahr 2024 zu betreiben

Nurdle startet bei Spectrum Labs als KI-Einsatzlösung für Unternehmen.

Most people like

ytRank.ai

10K

Im wettbewerbsintensiven Umfeld von YouTube kann die Nutzung von künstlicher Intelligenz (KI)-Werkzeugen Ihre Content-Strategie erheblich verbessern und das Wachstum Ihres Kanals beschleunigen. Entdecken Sie, wie diese innovativen Lösungen die Videoproduktion optimieren, die Interaktion mit dem Publikum steigern und nachhaltiges Wachstum für Ihren Kanal fördern können. Egal, ob Sie ein erfahrener Creator oder ein Anfänger sind, die Integration von KI in Ihren YouTube-Ansatz kann Ihre Inhalte auf neue Höhen heben.

YouTube-Tools AI YouTube Assistant

Compara.cat

15.5K

Compara.cat ist eine führende katalanische Plattform, die die Kraft der KI nutzt, um unparteiische Produktvergleiche bereitzustellen.

Produktvergleiche AI Product Description Generator

Rate My Physique

8.3K

Wir präsentieren eine KI-gestützte App zur Körperbewertung und individuellen Verbesserungstipps. Dieses innovative Tool bietet den Nutzern Einblicke in ihre physische Verfassung und unterstützt sie dabei, ihre Fitnessreise mit maßgeschneiderten Empfehlungen zu optimieren. Egal, ob Sie Muskeltonus steigern oder Ihr gesamtes Erscheinungsbild verbessern möchten, unsere App ist ein zuverlässiger Begleiter auf Ihrem Weg zu einem gesünderen Ich.

KI-Körperbewertung Fitness

AICreditRepair

Entdecken Sie innovative KI-Tools, die entwickelt wurden, um Kreditbewertungen effektiv zu verbessern und zu reparieren. Diese fortschrittlichen Technologien bieten maßgeschneiderte Lösungen, um Ihren Kreditbericht zu verstehen, Probleme zu identifizieren und Verbesserungsstrategien umzusetzen. Mit dem Aufstieg der künstlichen Intelligenz war es noch nie so einfach, Ihre Kreditgesundheit zu optimieren. Nutzen Sie das Potenzial dieser KI-gesteuerten Plattformen, um die Kontrolle über Ihre finanzielle Zukunft zu übernehmen.

Kreditreparatur Other

Find AI tools in YBX