Perplexity AI: Новый игрок на рынке поисковых систем
Perplexity AI, основанная год назад бывшими исследователями Google AI Энди Конвински, Аравиндом Сринивасом, Денисом Яратсом и Джонни Хо, стремится бросить вызов доминированию Google в веб-поиске. Объединив веб-индекс с актуальной информацией и интерфейсом разговорного ИИ, Perplexity намеревается переосмыслить опыт поиска. Ее чат-бот, Perplexity Copilot, ранее работал на основе опытных моделей ИИ — GPT-4 от OpenAI и Claude 2 от Anthropic, между которыми пользователи могли переключаться.
Недавно Perplexity добилась значительных успехов, выпустив свои собственные большие языковые модели (LLM), именуемые pplx-7b-online и pplx-70b-online, соответствующие их параметрическим размерам 7 миллиардов и 70 миллиардов соответственно. Эти модели основаны на открытых моделях mistral-7b и llama2-70b от Mistral и Meta.
Почему новые LLM Perplexity важны
LLM Perplexity заслуживают внимания по нескольким причинам. Во-первых, другие организации могут использовать их через API Perplexity, а во-вторых, они акцентируют внимание на предоставлении "полезной, фактической и актуальной информации". Это критическое преимущество, поскольку ведущие модели, такие как GPT-3.5 и GPT-4 от OpenAI, сталкиваются с проблемами устаревших данных.
Как отметил генеральный директор Аравинд Сринивас в X, новые LLM PPLX — это "первый в мире живой API LLM, основанный на данных веб-поиска и свободный от ограничений по знаниям". В отличие от GPT-3.5 и GPT-4, чьи знания ограничены сентябрем 2021 года (недавно продлено до начала 2023 года), модели Perplexity постоянно интегрируют актуальную информацию из сети.
Конкуренция в области актуальных знаний
Конкуренция за предоставление актуальных знаний через LLM чат-ботов усиливается. xAI Илонa Маска объявила, что Grok чат-бот будет использовать актуальную информацию из X (бывшего Twitter), которую уже имеют избранные пользователи и которая скоро будет доступна широкой аудитории.
Другие провайдеры LLM, такие как Toronto-based Cohere, также пытаются интегрировать свежие данные через возможности веб-серфинга и генерацию информации с улучшением поиска (RAG), позволяющую модели получать доступ к внешней информации, предоставляемой администратором.
Perplexity разработала собственную систему для получения актуальной информации, используя внутреннюю поисковую, индексационную и краулинговую инфраструктуру. В их блоге говорится: "Наш большой поисковый индекс регулярно обновляется и использует сложные алгоритмы ранжирования для обеспечения приоритетности качественного и релевантного контента". Эти обновления позволяют их моделям генерировать ответы, основанные на самых свежих данных.
Оценка производительности
Чтобы подтвердить эффективность своих новых LLM, Perplexity привлекла человеческих оценщиков для анализа их ответов по критериям полезности, фактичности и актуальности. Оценщики сравнили ответы моделей PPLX от Perplexity с ответами от Meta Llama 2 и GPT-3.5 Turbo от OpenAI.
С использованием системы оценки Elo Perplexity обнаружила, что ее модели превзошли как модели OpenAI, так и Meta по свежести и фактичности, хотя GPT-3.5 все еще отличалась полезностью.
Как получить доступ к LLM Perplexity
Новые LLM PPLX теперь доступны для физических и юридических лиц через API Perplexity, с документацией, доступной онлайн. Переходя от бета-версии к публичной доступности, требуется подписка стоимостью 20 долларов США в месяц (или 200 долларов в год) для уровня Pro. Это включает в себя $5 ежемесячного кредита для доступа к API, с дополнительными расходами, которые будут определены по запросу в Perplexity.
С растущей конкуренцией в области технологий поиска на основе ИИ Perplexity привлекла первых сторонников, таких как венчурный капиталист Джеремия Овянг, который видит огромный потенциал в ее подходе.
Поскольку Google Bard сталкивается с проблемами на фоне смешанных отзывов, а запуск модели ИИ Gemini от Google ожидает задержки, Perplexity стратегически расположена для создания своей уникальной ниши в будущем поиска, предлагая пользователям интерактивного ИИ помощника, который эффективно предоставляет актуальную информацию.