Улучшение логики генеративного ИИ: Google DeepMind представляет технологию GenRM

Home Новости ИИ Улучшение логики генеративного ИИ: Google DeepMind представляет технологию GenRM

Updated on сентябрь 3 2024

Google DeepMind представляет генеративный оценщик GenRM для улучшения способностей ИИ к рассуждению

27 августа 2023 года команда Google DeepMind опубликовала статью на arXiv, в которой представила свой инновационный генеративный оценщик GenRM. Эта новая модель вознаграждения предназначена для значительного улучшения способностей рассуждения генеративного ИИ.

В настоящее время преобладающим методом улучшения больших языковых моделей (LLMs) является подход "Лучший из N". Эта техника включает генерацию N кандидатных решений, которые затем оцениваются для определения наилучшего варианта. Однако традиционные оценщики LLM обычно функционируют лишь как дискриминационные классификаторы и не используют полноценно возможности текстовой генерации предобученных LLM.

Чтобы преодолеть это ограничение, команда DeepMind обучила оценщик с помощью прогнозирования следующего токена, совмещая валидацию и генерацию решений. GenRM обладает несколькими четко выраженными преимуществами по сравнению с обычными оценщиками:

- Бесшовная интеграция корректировки инструкций

- Поддержка рассуждений в цепочках мыслей

- Расчет дополнительного времени рассуждений с использованием большинства голосов

В задачах, связанных с алгоритмами и основами математического рассуждения, GenRM превзошел как дискриминационные оценщики, так и оценщиков LLM-as-a-Judge, продемонстрировав увеличение уровня успешного решения задач с 16% до 64% при тестировании с оценщиками на базе Gemma.

Google DeepMind утверждает, что GenRM представляет собой важную эволюцию в системах вознаграждения ИИ, особенно усиливая возможности предотвращения потенциального мошенничества в обучении новых моделей. Этот прогресс подчеркивает необходимость улучшения моделей вознаграждения, чтобы гарантировать, что результаты ИИ соответствуют стандартам социальной ответственности.

Добавлено 8 новых естественных звуков животных в OpenAI ChatGPT: ощутите более аутентичные лай и выражения животных.

Klarna сокращает рабочую силу наполовину: использование ИИ для поддержки стратегий бизнес-роста.

Most people like

SendFame

96.8K

Создавайте уникальные видеосообщения от ваших любимых знаменитостей с помощью передовой технологии ИИ SendFame. Наша платформа позволяет легко связываться со звездами, чтобы отправлять особые, персонализированные поздравления, которые сделают любое событие незабываемым.

видеосообщение AI Celebrity Voice Generator

Career.io

388K

Раскройте свой карьерный потенциал с нашей платформой карьерных услуг на базе ИИ Испытайте уникальную поддержку на вашем профессиональном пути с нашей инновационной платформой карьерных услуг на основе ИИ. Мы предлагаем персонализированные ресурсы и экспертное руководство, адаптированные к вашим уникальным карьерным целям. Сделайте первый шаг к достижению своих мечт уже сегодня!

услуги по трудоустройству AI Recruiting

Erota AI-written erotic stories

24.2K

Погрузитесь в захватывающий мир эротических историй, созданных ИИ и специально для ваших фантазий. Откройте для себя вселенную, где ваши желания оживают в увлекательных и ярких повествованиях, которые завораживают и развлекают.

эротические истории Large Language Models (LLMs)

Curiosity

66.2K

Легко находите все свои приложения и файлы в одном центре. Ощутите бесшовную организацию и быстрый доступ ко всему необходимому из единого поискового центра.

Поиск AI Email Assistant

Find AI tools in YBX