Запуск публичного просмотра Google Gemini 1.5 Pro: исследуем новые функции распознавания голоса.

Home Новости ИИ Запуск публичного просмотра Google Gemini 1.5 Pro: исследуем новые функции распознавания голоса.

Updated on апрель 10 2024

На недавнем мероприятии Google Next компания представила значительное обновление своей модели ИИ Gemini 1.5 Pro, которая теперь обладает беспрецедентными возможностями обработки аудио. Gemini 1.5 Pro может напрямую интерпретировать и анализировать загружаемые аудиофайлы, извлекая полезную информацию из прибыльных звонков или аудио видеозаписей без необходимости в письменных транскрипциях.

Ключевым моментом этого обновления является то, что Gemini 1.5 Pro превзошел предыдущую наиболее мощную модель в серии, Gemini Ultra, по производительности. Google отметила, что эта модель может понимать сложные команды без необходимости в тонкой настройке, что является значительным шагом вперед в технологиях ИИ.

Важно отметить, что доступ к Gemini 1.5 Pro ограничен пользователями с возможностями в Vertex AI и AI Studio. Большинство пользователей взаимодействуют с языковыми моделями Gemini через чат-бота Gemini, в то время как Gemini Ultra поддерживает более продвинутые чат-боты. Несмотря на свою мощь, Gemini Ultra не может соперничать со скоростью Gemini 1.5 Pro.

Кроме того, Google анонсировала обновления для другой крупной модели ИИ - Imagen 2. Эта продвинутая система генерации изображений из текста улучшает возможности Gemini, позволяя пользователям добавлять или удалять элементы на изображениях. Google также представила SynthID - функцию цифрового водяного знака для всех изображений, созданных с помощью модели Imagen, который внедряет невидимый маркер для указания источника изображений.

Также Google продемонстрировала новый метод интеграции ответов ИИ с Google Search, что позволяет предоставлять ответы на основе информации в реальном времени. Это означает, что большие языковые модели смогут предоставить актуальные данные, а не полагаться только на заранее существующую информацию. Однако Google решила ограничить Gemini в ответах на вопросы, связанные с выборами в США в 2024 году, демонстрируя приверженность ответственному обращению с чувствительной информацией.

Стоит отметить, что Gemini подвергался критике за генерацию неточных изображений исторических фигур, что напоминает нам о необходимости осторожности при обращении с историческими и реальными данными, несмотря на достижения в области технологий ИИ.

Новые тренды в электронной коммерции в эпоху ИИ: eBay запускает умный шопинг для модной координации

Google Imagen 2 представляет функцию «Текст в анимацию»: сможет ли ИИ революционизировать создание GIF?

Most people like

创一

6.8K

Представляем инновационный инструмент ИИ, созданный специально для эффективного написания коротких сценариев для видео. Эта передовая технология упрощает ваш процесс создания сценариев, делая его быстрее и удобнее, чтобы вы могли сосредоточиться на создании увлекательного контента для вашей аудитории. Независимо от того, являетесь вы создателем контента, маркетологом или педагогом, наш инструмент ИИ поможет вам быстро сформировать захватывающие сценарии. Трансформируйте свой процесс видеопроизводства и раскройте свой творческий потенциал с легкостью.

Сценарий короткого видео с ИИ AI Script Writing

Storywizard.ai

12.6K

Откройте для себя современную платформу, использующую искусственный интеллект для предоставления индивидуальных образовательных программ, разработанных специально для детей.

Платформа на базе ИИ AI Story Writing

Dittin AI V2

84.1K

Добро пожаловать в Сообщество Инклюзивных ИИ Чатботов, где мы объединяем новаторов, разработчиков и энтузиастов, стремящихся создать доступные и удобные ИИ чатботы. Наша миссия — содействовать сотрудничеству, делиться знаниями и продвигать лучшие практики, которые гарантируют, что технологии служат всем, вне зависимости от их прошлого или возможностей. Присоединяйтесь к нам в исследовании будущего ИИ чатботов, акцентируя внимание на инклюзивности и создании более справедливого цифрового мира для всех.

Создание персонажей на основе ИИ AI Chatbot

JCV - Japan Computer Vision

25.9K

Революция в отраслях благодаря передовым технологиям компьютерного зрения.

Компьютерное зрение AI Image Recognition

Find AI tools in YBX