На недавней конференции для разработчиков Google I/O компания сделала акцент на своих технологиях искусственного интеллекта (ИИ), упомянув "ИИ" более 120 раз. Для того чтобы вы были в курсе новых ИИ-продуктов и функций, представленных на мероприятии, вот основные итоги Google I/O 2024.
Генеративный ИИ в поиске
Google планирует внедрить генеративный ИИ в свои результаты поиска для улучшения организации информации. Когда пользователи ищут вдохновение, особенно при планировании поездок, на странице результатов будут отображаться ИИ-сгенерированные резюме отзывов, обсуждения из социальных сетей и подобранные списки предложений. В будущем эти улучшенные результаты расширятся на выбор еды, рецепты, фильмы и книги.
Project Astra и Gemini Live
Google улучшает свой ИИ-чатбот Gemini с помощью новой функции Gemini Live. В скором времени пользователи смогут общаться с Gemini голосом через смартфоны и корректировать свои вопросы в реальном времени. Эта технология позволяет Gemini использовать камеру телефона для понимания окружающей среды, распознавая районы или объекты. Этот инновационный функционал является частью Project Astra, который нацелен на понимание информации в реальном времени с помощью ИИ.
Google Veo
Представляя новую модель Veo, Google разработала инструмент, способный создавать видеоролики продолжительностью около одной минуты в разрешении 1080p на основе текстовых подсказок. Veo может передавать различные визуальные стили и понимает движения камеры и эффекты, создавая вполне реалистичные видеоролики. Кроме того, Veo включает возможности маскирования, позволяя преобразовывать статичные изображения в динамичные видео.
Ask Photos
Google Photos запускает функцию "Ask Photos", позволяющую пользователям задавать вопросы о своих фотоколлекциях, используя естественный язык. На основе Gemini эта функция обеспечит сложные поиски, например, поиск лучших фотографий из определенного места. Ожидается, что функция будет доступна этим летом.
Gemini в Gmail
Пользователи Gmail смогут скоро использовать Gemini для поиска, резюмирования и составления писем. Пользователи смогут давать команды Gemini извлекать и организовывать ключевую информацию из писем, включая PDF-вложения, облегчая получение актуальной информации о новостях из школы или управление чеками.
Обнаружение мошенничества во время звонков
Google представила новую функцию, которая использует Gemini Nano для выявления потенциальной мошеннической активности в реальном времени во время телефонных разговоров. Эта функция будет включена в будущие версии Android и сможет выявлять шаблоны разговора, связанные с мошенничеством.
Доступность с помощью ИИ
Google улучшила функцию TalkBack для людей с нарушениями зрения, добавив генеративный ИИ, который предоставляет аудиописания объектов. TalkBack будет автоматически генерировать описания изображений, значительно улучшая доступность для людей с проблемами зрения.
Эти инновации отражают проактивный подход Google к ИИ, обещая более умный и удобный пользовательский опыт в будущем.