Запуск публичного просмотра Google Gemini 1.5 Pro: исследуем новые функции распознавания голоса.

На недавнем мероприятии Google Next компания представила значительное обновление своей модели ИИ Gemini 1.5 Pro, которая теперь обладает беспрецедентными возможностями обработки аудио. Gemini 1.5 Pro может напрямую интерпретировать и анализировать загружаемые аудиофайлы, извлекая полезную информацию из прибыльных звонков или аудио видеозаписей без необходимости в письменных транскрипциях.

Ключевым моментом этого обновления является то, что Gemini 1.5 Pro превзошел предыдущую наиболее мощную модель в серии, Gemini Ultra, по производительности. Google отметила, что эта модель может понимать сложные команды без необходимости в тонкой настройке, что является значительным шагом вперед в технологиях ИИ.

Важно отметить, что доступ к Gemini 1.5 Pro ограничен пользователями с возможностями в Vertex AI и AI Studio. Большинство пользователей взаимодействуют с языковыми моделями Gemini через чат-бота Gemini, в то время как Gemini Ultra поддерживает более продвинутые чат-боты. Несмотря на свою мощь, Gemini Ultra не может соперничать со скоростью Gemini 1.5 Pro.

Кроме того, Google анонсировала обновления для другой крупной модели ИИ - Imagen 2. Эта продвинутая система генерации изображений из текста улучшает возможности Gemini, позволяя пользователям добавлять или удалять элементы на изображениях. Google также представила SynthID - функцию цифрового водяного знака для всех изображений, созданных с помощью модели Imagen, который внедряет невидимый маркер для указания источника изображений.

Также Google продемонстрировала новый метод интеграции ответов ИИ с Google Search, что позволяет предоставлять ответы на основе информации в реальном времени. Это означает, что большие языковые модели смогут предоставить актуальные данные, а не полагаться только на заранее существующую информацию. Однако Google решила ограничить Gemini в ответах на вопросы, связанные с выборами в США в 2024 году, демонстрируя приверженность ответственному обращению с чувствительной информацией.

Стоит отметить, что Gemini подвергался критике за генерацию неточных изображений исторических фигур, что напоминает нам о необходимости осторожности при обращении с историческими и реальными данными, несмотря на достижения в области технологий ИИ.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles