Google Gemini Pro: Скоро в запуске для бизнеса и разработчиков

Google представляет свою последнюю разработку — модель Gemini, которая предлагает бизнесу и разработчикам возможность первыми оценить мощные возможности большого языка через доступный API. Gemini доступна в трёх размерах: Ultra, Pro и Nano. Начиная с сегодняшнего дня, разработчики могут получить доступ к API Gemini Pro через бесплатный веб-инструмент Google для разработчиков, AI Studio (ранее известный как Makersuite), в то время как предприятия могут интегрировать его через платформу Vertex AI от Google Cloud, что позволяет быстро создавать приложения.

Google планирует доработать Gemini Pro на основе отзывов пользователей в ближайшие недели. «Мы с нетерпением ожидаем инновационных приложений, которые разработчики и предприятия создадут с использованием Gemini», — сообщила компания в недавнем блоге. В настоящее время Gemini Pro поддерживает Bard, разговорный ИИ Google, который конкурирует с ChatGPT. Одной из ключевых особенностей первой версии является контекстный размер в 32,000 токенов, что позволяет обрабатывать примерно 5,333 слова. Для сравнения, OpenAI GPT-4 Turbo может обрабатывать до 128,000 токенов, однако будущие версии Gemini Pro ожидаются с значительно увеличенной ёмкостью.

Среди особенностей Gemini Pro — поддержка 38 языков, вызов функций, встраивание, семантический поиск и базирование на пользовательских знаниях. В настоящее время API работает исключительно с текстовым вводом и выводом. Однако был запущен мультимодальный эндпоинт — Gemini Pro Vision — который принимает как текстовые, так и визуальные входные данные, включая изображения и видео, создавая текстовые выводы на их основе.

На данный момент API Gemini Pro бесплатен, но ограничен 60 запросами в минуту. Вскоре будет представлена версия "плати по мере использования", обещающая меньше ограничений с конкурентоспособной ценовой политикой. Цены на Gemini Pro установлены на уровне $0.00025 за тысячу символов и $0.0025 за изображение, при этом вывод тарифицируется по $0.0005 за тысячу символов. Данные из бесплатной версии будут использованы Google для улучшения своих предложений, тогда как информация из платной версии останется конфиденциальной.

Кроме модели Gemini Pro, Google расширяет свою платформу Vertex новыми моделями, включая Imagen 2 — последнюю модель генерации изображений от Google DeepMind. Эта продвинутая модель диффузии текста в изображение может создавать качественные изображения и даже реальные логотипы для компаний. Она также умеет обрабатывать текст на нескольких языках.

Другим значимым дополнением является MedLM — набор базовых моделей, специально настроенных для сектора здравоохранения. Созданный на основе модели Med-PaLM 2, MedLM предназначен для таких приложений, как ведение медицинских заметок и ответ на вопросы, связанные с здравоохранением. В настоящее время эта модель доступна исключительно для пользователей Vertex из США, с планами расширить доступ в ближайшие недели. Google также планирует интегрировать модели на базе Gemini в набор MedLM в ближайшее время.

Наконец, инструмент Duet AI для разработчиков теперь доступен в общем доступе. Этот инструмент коллаборации помогает разработчикам оптимизировать процесс создания приложений и может быть интегрирован в различные интерфейсы Google Cloud для генерации кода и помощи в чате. В течение следующих нескольких недель Gemini будет интегрирован в Duet AI, который также будет расширять функциональность в области операций безопасности, улучшая сотрудничество защитников в единой платформе SecOps.

С этими инновационными инструментами Google закладывает основу для новой эпохи приложений на основе ИИ, которые обещают повысить продуктивность, креативность и безопасность в различных отраслях.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles