Борьба с дезинформацией в чат-ботах: Google DeepMind и Стэндфордский университет запускают инструмент для проверки фактов на основе ИИ

Home Аппаратное обеспечение Борьба с дезинформацией в чат-ботах: Google DeepMind и Стэндфордский университет запускают инструмент для проверки фактов на основе ИИ

Updated on апрель 1 2024

31 марта в свежих отчетах сообщается, что, несмотря на достижения в технологиях ИИ-чатботов, по-прежнему существует общая проблема: эти системы часто предоставляют фактически неверные ответы. Это явление, известное как "галлюцинация", происходит, когда ИИ генерирует информацию, которая выглядит достоверной, но на самом деле является ошибочной.

Чтобы решить эту задачу, исследователи из Google DeepMind и Стэнфордского университета разработали инструмент под названием Search-Enhanced Fact Evaluator (SAFE). Этот инструмент использует крупные языковые модели для проверки фактов в длинных ответах, сгенерированных чатботами. Результаты их исследований, экспериментальный код и наборы данных были опубликованы.

Система SAFE проверяет точность и достоверность ответов, созданных ИИ, в четыре этапа: сначала она разбивает ответ на отдельные утверждения, которые нужно проверить. Затем исправляет эти утверждения по мере необходимости. Третьим шагом является сравнение утверждений с результатами поиска в Google. Наконец, система оценивает актуальность каждого факта по отношению к исходному запросу.

Чтобы оценить эффективность системы, исследователи создали набор данных под названием LongFact, который содержит примерно 16,000 фактов, и протестировали SAFE на 13 крупных языковых моделях, включая Claude, Gemini, GPT и PaLM-2. Результаты показали, что при анализе 100 спорных фактов SAFE достигла точности 76% после дополнительной проверки. Кроме того, система демонстрирует значительную экономию затрат, расходы составляют более чем в 20 раз меньше, чем при ручной аннотации. Это достижение является важным шагом к улучшению надежности ИИ-чатботов.

Samsung улучшает Bixby с помощью функций генеративного ИИ для более умной помощи.

Google: Мобильные модели ИИ потребляют значительные объемы оперативной памяти

Most people like

CodeSquire - AI code writing assistant

7.1K

CodeSquire — это инновационный ИИ-ассистент, специально разработанный для специалистов по данным, который без усилий генерирует кодовые функции для оптимизации рабочего процесса и повышения продуктивности.

ИИ AI Code Assistant

Takeoff

153K

Повышайте свою экспертность в области ИИ с помощью тщательно отобранных онлайн-курсов, призванных развить ваши навыки и знания в искусственном интеллекте.

Искусственный интеллект обучение AI Course

Maika AI

57.5K

Откройте для себя идеальный инструмент создания контента на базе ИИ, разработанный специально для маркетологов и создателей контента. Улучшите свою контент-стратегию, оптимизируйте рабочие процессы и эффективно взаимодействуйте с аудиторией с помощью передовых технологий искусственного интеллекта. Раскройте свой творческий потенциал и поднимите свои маркетинговые кампании на новый уровень уже сегодня!

Исследования в области ИИ AI SEO Assistant

Objective, Inc

11.2K

Представляем наш API поиска, созданный специально для веб- и мобильных приложений. Улучшите пользовательский опыт с помощью современных поисковых функций, использующих искусственный интеллект для предоставления высокорелевантных результатов. Наш API оптимизирует эффективность поиска, обеспечивая бесшовную интеграцию и повышая вовлеченность в ваши приложения. Откройте для себя потенциал интеллектуальных возможностей поиска уже сегодня!

AI-родной AI Search Engine

Find AI tools in YBX