На недавнем мероприятии Google Next компания представила значительное обновление своей модели ИИ Gemini 1.5 Pro, которая теперь обладает беспрецедентными возможностями обработки аудио. Gemini 1.5 Pro может напрямую интерпретировать и анализировать загружаемые аудиофайлы, извлекая полезную информацию из прибыльных звонков или аудио видеозаписей без необходимости в письменных транскрипциях.
Ключевым моментом этого обновления является то, что Gemini 1.5 Pro превзошел предыдущую наиболее мощную модель в серии, Gemini Ultra, по производительности. Google отметила, что эта модель может понимать сложные команды без необходимости в тонкой настройке, что является значительным шагом вперед в технологиях ИИ.
Важно отметить, что доступ к Gemini 1.5 Pro ограничен пользователями с возможностями в Vertex AI и AI Studio. Большинство пользователей взаимодействуют с языковыми моделями Gemini через чат-бота Gemini, в то время как Gemini Ultra поддерживает более продвинутые чат-боты. Несмотря на свою мощь, Gemini Ultra не может соперничать со скоростью Gemini 1.5 Pro.
Кроме того, Google анонсировала обновления для другой крупной модели ИИ - Imagen 2. Эта продвинутая система генерации изображений из текста улучшает возможности Gemini, позволяя пользователям добавлять или удалять элементы на изображениях. Google также представила SynthID - функцию цифрового водяного знака для всех изображений, созданных с помощью модели Imagen, который внедряет невидимый маркер для указания источника изображений.
Также Google продемонстрировала новый метод интеграции ответов ИИ с Google Search, что позволяет предоставлять ответы на основе информации в реальном времени. Это означает, что большие языковые модели смогут предоставить актуальные данные, а не полагаться только на заранее существующую информацию. Однако Google решила ограничить Gemini в ответах на вопросы, связанные с выборами в США в 2024 году, демонстрируя приверженность ответственному обращению с чувствительной информацией.
Стоит отметить, что Gemini подвергался критике за генерацию неточных изображений исторических фигур, что напоминает нам о необходимости осторожности при обращении с историческими и реальными данными, несмотря на достижения в области технологий ИИ.