Dans la quête d'une utilisation optimale de l'IA pour les bibliothèques de connaissances des entreprises, des informations essentielles peuvent souvent être négligées. L’upload d'images, de vidéos, de documents et de feuilles de calcul pour entraîner des modèles est relativement simple. En revanche, les données non structurées comme les factures, les e-mails et les PDF représentent un défi. La conversion manuelle de ces fichiers en un format consultable est laborieuse et dépasse souvent les capacités des équipes d’ingénierie manquant d’expertise en apprentissage automatique.
Cependant, une entreprise, Bem, fondée par Antonio Bustamante et Upal Saha, vise à combler cette lacune. Bem propose une API qui permet aux développeurs de convertir tout type d'entrée—structuré ou non—en n'importe quel format de données souhaité. La startup a levé avec succès 3,7 millions de dollars lors d'un tour de table de financement amorçage, dirigé par Uncork Capital, avec la participation de Kevin Mahaffey, fondateur de Lookout, Roar Ventures et d'investisseurs providentiels notables, dont Garry Tan de Y Combinator.
« Les équipes d’ingénierie consacrent environ 44 % de leur temps à construire, surveiller et maintenir des pipelines de données », explique Bustamante. « Bem s'engage à redéfinir l'interopérabilité et l'intégration, permettant aux équipes de se concentrer sur ce qui compte vraiment : leur produit. Notre objectif est d'alléger le fardeau des intégrations et des pipelines d'ingestion de données pour que les ingénieurs puissent se concentrer sur la création de valeur pour leurs utilisateurs. »
Données Structurées en tant que Service
S’adressant aux ingénieurs, Bem se distingue par son approche conviviale, ne nécessitant ni formation extensive ni configuration complexe. Les développeurs peuvent facilement utiliser l'API pour définir leur structure de données désirée avant de soumettre leurs informations. Bustamante compare cela à la manière dont Stripe a simplifié le traitement des paiements grâce à une API accessible.
Bem propose plus qu'un service ponctuel ; elle établit un pipeline de données continu qui transmet les informations entre l'organisation et Bem. « Nos clients nous envoient des milliers de données chaque minute, créant un flux constant », explique-t-il.
La plateforme fonctionne efficacement comme un Service de Données Structurées (SDaaS). Bustamante souligne : « Beaucoup d'entrées des entreprises sont désorganisées. Nos utilisateurs ont simplement besoin d'une version structurée conforme à leur format de données interne et à leur schéma. Nous offrons un service de transformation et de structuration. »
Bem voit un potentiel significatif dans son offre. De nombreuses entreprises sont trop occupées pour développer leurs propres solutions face à ce que Bustamante décrit comme une problématique pressante. La startup aide principalement les sociétés de logiciels dans des secteurs comme la logistique, la chaîne d'approvisionnement, la santé et l'assurance, qui rencontrent les plus grands défis liés aux données non structurées.
La plupart des solutions disponibles sont conçues pour des flux de travail de révision de documents, tandis que Bem fournit un bloc de construction fondamental pour l'intégration de produits, visant directement les applications destinées aux utilisateurs finaux, contrairement aux concurrents mieux adaptés aux processus de back-office.
Gestion Innovante des Données
Bem a développé sa plateforme en combinant des modèles fondamentaux et open-source, améliorant continuellement son intelligence grâce aux interactions avec les clients. La plateforme garantit également l'isolation des données, avec des modèles entraînés exclusivement sur les données des clients.
Actuellement en version bêta privée, Bem compte dix clients précoces et cible principalement les entreprises en phase de financement de série C et au-delà. Bustamante souligne que le besoin d'une gestion efficace des données devient particulièrement évident à ce niveau de croissance, notamment dans les secteurs de la logistique, de la chaîne d'approvisionnement, de la santé et de l'assurance.
Le récent financement de 3,7 millions de dollars sera consacré à l'amélioration de la plateforme de Bem, en particulier dans les domaines de l'ingénierie, de la recherche et du développement.
« Les entreprises ont souvent du mal avec l'ingestion de données encombrantes », déclare Andy McLoughlin, associé directeur chez Uncork Capital. « La solution de Bem, qui automatise et rationalise ce processus, est un service vital. Ce problème touche tous les secteurs, mais il est particulièrement aigu dans des domaines comme l'assurance et la logistique. »
McLoughlin souligne que Bem démocratise les données et permet aux entreprises de les gérer efficacement. Historiquement, seules les grandes entreprises technologiques ont su tirer parti de telles capacités de transformation des données. À mesure que les entreprises recherchent des outils plus efficaces, celles qui réussissent à commercialiser ces solutions devraient gagner une traction substantielle.
Sur le plan concurrentiel, le PDG de Bem identifie Unstructured comme un acteur notable, bien qu'il note leurs marchés cibles différents, Unstructured se concentrant exclusivement sur le traitement de documents. Cependant, les principaux concurrents de Bem demeurent les entreprises qui tentent de construire des capacités similaires en interne. Bustamante souligne que de nombreux clients réalisent rapidement les coûts élevés associés au développement interne.
Les tarifs des services de Bem sont actuellement déterminés au cas par cas, selon les données gérées. Au cours des mois à venir, l'entreprise prévoit de normaliser sa structure tarifaire afin d'assurer la transparence et de garantir un retour sur investissement solide, avec un objectif de ROI de 25 à 30 fois, compte tenu des défis considérables posés par les données non structurées.
Les détails de valorisation n'ont pas été divulgués.