Perplexity AI : Un Nouveau Contender sur le Marché des Moteurs de Recherche
Perplexity AI, fondée il y a un an par d'anciens chercheurs en IA de Google, Andy Konwinski, Aravind Srinivas, Denis Yarats et Johnny Ho, se prépare à défier la domination de Google dans la recherche en ligne. En combinant un index web avec des informations en temps réel et une interface de chatbot IA, Perplexity vise à redéfinir l'expérience de recherche. Son chatbot, Perplexity Copilot, utilisait auparavant des modèles d'IA établis—GPT-4 d'OpenAI et Claude 2 d'Anthropic—qui permettaient aux abonnés de passer de l'un à l'autre.
Récemment, Perplexity a réalisé des avancées significatives en lançant ses propres modèles de langage robustes (LLM), nommés pplx-7b-online et pplx-70b-online, correspondant respectivement à leurs tailles de paramètres de 7 milliards et 70 milliards. Ces modèles s'appuient sur les modèles open-source mistral-7b et llama2-70b de Mistral et Meta.
Pourquoi les Nouveaux LLM de Perplexity Importent
Les LLM de Perplexity sont remarquables pour plusieurs raisons. D'autres organisations peuvent les utiliser via l'API de Perplexity, et ils mettent l'accent sur la fourniture d'informations « utiles, factuelles et à jour ». Cet avantage est crucial, car les modèles leaders comme GPT-3.5 et GPT-4 d'OpenAI ont rencontré des difficultés avec des connaissances obsolètes.
Comme l'a souligné le PDG Aravind Srinivas sur X, les nouveaux LLM PPLX sont « les premières APIs LLM en direct ancrées dans des données de recherche web, exemptes de coupures de connaissances ». Contrairement à GPT-3.5 et GPT-4, dont les connaissances étaient limitées à septembre 2021 (récemment étendues au début de 2023), les modèles de Perplexity intègrent en continu des informations en temps réel provenant du web.
Concurrence pour des Connaissances en Temps Réel
La concurrence pour fournir des connaissances actualisées via des chatbots LLM s'intensifie. La société xAI d’Elon Musk a annoncé que son chatbot Grok s'appuiera sur des informations en temps réel de X (anciennement Twitter), déjà accessibles à certains utilisateurs et bientôt déployées de manière plus large.
D'autres fournisseurs de LLM, comme Cohere basé à Toronto, tentent également d'intégrer des données récentes via des capacités de navigation web et la génération augmentée par récupération (RAG), permettant au modèle d'accéder à des informations externes fournies par un administrateur.
Perplexity a développé son propre système pour l'acquisition d'informations en temps réel, employant une infrastructure interne de recherche, d'indexation et de crawling. Leur blog indique : « Notre vaste index de recherche est mis à jour régulièrement et utilise des algorithmes de classement sophistiqués pour assurer la priorité au contenu de haute qualité et pertinent. » Ces mises à jour permettent à leurs modèles de générer des réponses ancrées dans les dernières données disponibles.
Évaluation des Performances
Pour valider l'efficacité de ses nouveaux LLM, Perplexity a engagé des évaluateurs humains pour analyser leurs réponses en fonction de l'utilité, de la factualité et de la fraîcheur. Les évaluateurs ont comparé les réponses des modèles PPLX de Perplexity avec celles de Llama 2 de Meta et de GPT-3.5 Turbo d'OpenAI.
En utilisant un système de notation Elo, Perplexity a constaté que ses modèles surpassaient ceux d'OpenAI et de Meta en termes de fraîcheur et de factualité, bien que GPT-3.5 ait encore excellé en utilité.
Comment Accéder aux LLM de Perplexity
Les nouveaux LLM PPLX sont maintenant accessibles aux particuliers et aux organisations via l'API de Perplexity, avec une documentation disponible en ligne. Passant de la version bêta à la disponibilité publique, un abonnement de 20 USD par mois (ou 200 USD par an) est requis pour le niveau Pro, incluant un crédit mensuel de 5 USD pour l'accès à l'API, avec des frais d'utilisation supplémentaires à déterminer directement auprès de Perplexity.
Face à la concurrence croissante dans la technologie de recherche alimentée par l'IA, Perplexity a attiré des soutiens précoces comme le capital-risqueur Jeremiah Owyang, qui voit un grand potentiel dans son approche.
Alors que Google Bard fait face à des critiques mitigées et que le lancement du modèle d'IA Gemini de Google est reporté, Perplexity est stratégiquement positionné pour se tailler une niche distincte dans l'avenir de la recherche, offrant aux utilisateurs un assistant IA interactif qui met efficacement en avant des informations en temps réel.