L'intelligence artificielle a révolutionné le fonctionnement des entreprises et la gestion des données. Il y a quelques années, les équipes devaient rédiger des requêtes SQL et du code pour extraire des informations significatives à partir de grandes quantités de données. Aujourd'hui, il leur suffit de poser une question et de laisser des systèmes avancés de modèles linguistiques s'occuper du reste, permettant des interactions rapides et intuitives avec leurs données.
Malgré la promesse de ces nouveaux systèmes de requête, des défis persistent. Les modèles actuels peinent à traiter un large éventail de requêtes, incitant des chercheurs de UC Berkeley et de Stanford à développer une nouvelle solution appelée génération augmentée par table (TAG).
Qu'est-ce que la génération augmentée par table ?
TAG est une approche unifiée qui améliore les interactions entre les modèles linguistiques (ML) et les bases de données, proposant un paradigme novateur pour exploiter les connaissances du monde et les capacités de raisonnement des ML. Selon les résultats des chercheurs, TAG permet des requêtes en langage naturel plus sophistiquées sur des sources de données personnalisées.
Comment fonctionne TAG ?
Lorsque les utilisateurs posent des questions, deux méthodes principales sont couramment utilisées : la conversion texte-en-SQL et la génération augmentée par récupération (RAG). Bien qu'efficaces dans une certaine mesure, ces deux méthodes montrent leurs limites face à des requêtes complexes. La conversion texte-en-SQL traduit le langage naturel en requêtes SQL, mais ne couvre qu'un ensemble limité de questions d'algèbre relationnelle. D'autre part, la RAG se concentre sur la recherche rapide de réponses directes au sein de quelques enregistrements de la base de données.
Les deux méthodes peinent souvent avec des questions nécessitant un raisonnement sémantique ou des connaissances au-delà des données elles-mêmes. Comme l'ont noté les chercheurs, les requêtes réelles impliquent souvent des mélanges complexes d'expertise sectorielle, de connaissances générales et de calcul précis – des domaines où les systèmes de bases de données traditionnels excellent mais sont insuffisants seuls.
Pour combler ce vide, l'approche TAG adopte un modèle en trois étapes pour les requêtes conversationnelles :
1. Synthèse de la requête : Le ML identifie les données pertinentes et convertit l'entrée en une requête exécutable pour la base de données.
2. Exécution de la requête : Le moteur de base de données exécute la requête sur de vastes dépôts de données et récupère les informations les plus pertinentes.
3. Génération de réponse : Enfin, le ML génère une réponse en langage naturel basée sur les résultats de la requête exécutée.
Ce cadre innovant permet d'intégrer les capacités de raisonnement des modèles linguistiques avec l'exécution robuste des requêtes de bases de données, facilitant le traitement de questions complexes nécessitant un raisonnement sémantique approfondi, des connaissances générales et une expertise sectorielle.
Améliorations des performances avec TAG
Pour évaluer l'efficacité de TAG, les chercheurs ont utilisé BIRD, un ensemble de données conçu pour tester les capacités texte-en-SQL, et l'ont adapté pour inclure des questions nécessitant un raisonnement sémantique. Ils ont évalué TAG par rapport à plusieurs références, y compris texte-en-SQL et RAG.
Les résultats ont montré que, bien que toutes les méthodes de référence n'aient atteint qu'un niveau de précision de 20% au maximum, TAG a surpassé avec un taux de précision de 40% ou plus. Le modèle TAG manuscrit a correctement répondu à 55% des requêtes, avec un taux de succès de 65% pour les comparaisons de correspondance exacte. À travers divers types de requêtes, TAG a montré une performance constante supérieure à 50% de précision, particulièrement efficace dans des comparaisons complexes.
De plus, les implémentations de TAG ont atteint des vitesses d'exécution des requêtes trois fois plus rapides que celles des autres méthodes de référence, démontrant le potentiel pour les entreprises d'unifier l'IA avec les capacités des bases de données pour extraire des informations précieuses sans nécessiter d'efforts de codage intensifs.
Bien que TAG montre des résultats prometteurs, des perfectionnements supplémentaires sont nécessaires. L'équipe de recherche propose une exploration complémentaire sur la conception efficace des systèmes TAG. Pour soutenir l'expérimentation continue, le benchmark TAG modifié est désormais disponible sur GitHub.
En conclusion, TAG représente une avancée significative dans le domaine des requêtes pilotées par l'IA, ouvrant la voie aux entreprises pour améliorer leurs processus d'extraction de données et leurs capacités de prise de décision.