В эпоху генеративного ИИ чат-боты становятся более распространенными, но действительно ли они более полезны и точны? Сегодня Vectara, платформа для генеративного ИИ, представила новый модуль, разработанный для того, чтобы помочь предприятиям создавать и внедрять высокоточными чат-ботами. Используя метод Retrieval Augmented Generation (RAG) в сочетании с векторными эмбеддингами Boomerang, Vectara гарантирует предоставление актуальной информации, минимизируя риск ошибок. С момента своего выхода из режима «стелс» в октябре 2022 года Vectara постепенно улучшала свою платформу в соответствии с потребностями пользователей, а запуск этого модуля чата стал значительным расширением её возможностей.
«Когда вы используете нашу функцию чата, она использует RAG для генерации ответов», — сказал Таллат Шафаат, сооснователь и главный архитектор Vectara. «Ответы поступают из ваших собственных документов, что повышает точность».
Современные Чат-боты: От Вопросов и Ответов к Разговорному ИИ
Что отличает новый модуль Chаt от предыдущих предложений Vectara? По словам Амра Авадаллы, сооснователя и генерального директора Vectara, ключевое значение имеет масштабируемость и постоянство беседы.
Ранее API Vectara сосредоточивался в основном на взаимодействиях типа вопрос-ответ, когда пользователи задавали вопрос и получали ответ. Если у пользователей возникали последующие вопросы, им необходимо было повторно формулировать первоначальный запрос из-за статeless-подхода Vectara, который не сохранял историю беседы. Эта ограниченность часто требовала от клиентов создания собственных слоёв для сохранения состояния беседы. Однако новый модуль Vectara Chat изменяет эту ситуацию, интегрируя постоянную память, позволяя платформе бесшовно отслеживать историю общения. «Это новое расширение позволяет нашему API сохранять историю разговоров, так что нет необходимости переформулировать предыдущие запросы», — отметил Авадалла.
Для внедрения Vectara предлагает как API, так и простые виджеты для организации, позволяя легко интегрировать модуль чата на свои вебсайты или приложения, используя всего лишь несколько строк JavaScript и HTML.
Смотрев в будущее, Шафаат отметил планы по улучшению Vectara Chat с добавлением дополнительных функций управления для бизнеса. Владельцы аккаунтов смогут семантически анализировать истории чатов клиентов, получая информацию о пользовательских настроениях и трендах запросов. Функциональность запросов на основе RAG также упростит анализ пользовательских чатов.
Преодоление Ошибок и Предвзятости в Генеративном ИИ
Существенной проблемой при использовании генеративного ИИ в бизнесе является риск возникновения ошибок. Подход RAG от Vectara — это один из нескольких стратегий, разработанных для снижения вероятности неточных ответов в ее модуле чата.
Авадалла подчеркнул, что система Vectara предлагает объяснимые ответы с цитированием, повышая точность. Платформа также включает в себя методы снижения предвзятости с помощью новаторского подхода, известного как максимальная маргинальная релевантность. «Максимальная маргинальная релевантность увеличивает разнообразие результатов, которые мы возвращаем», — объяснил он.
Авадалла добавил, что для спорных тем с различными мнениями необходима надежная алгоритмическая поддержка для представления множественных точек зрения. «Мы гарантируем, что фиксируем как основные взгляды, так и второстепенные мнения, даже если они менее актуальны», — заявил он.
Сосредоточившись на точности, разнообразии и вовлеченности пользователей, Vectara стремится повысить роль чат-ботов в корпоративной коммуникации.