Amazon Web Services (AWS), долгое время считавшаяся отстающей по сравнению с конкурентами Microsoft Azure и Google Cloud в области генеративного ИИ, меняет свою стратегию. На недавней конференции AWS Re:Invent компания представила ряд стратегических новшеств, подтверждающих её стремление возглавить сферу генеративного ИИ для бизнеса.
Ключевые моменты конференции:
1. Расширенный выбор LLM: AWS улучшила свою службу Bedrock, добавив новые модели, в частности, Claude 2.1 от Anthropic, которая предлагает впечатляющее окно контекста в 200К токенов и сниженные уровни галлюцинаций. Это подчеркивает стремление AWS предлагать разнообразные большие языковые модели (LLM) в отличие от зависимости Microsoft от OpenAI.
2. Мультимодальные векторные встраивания: Сивасубраманиан представил Titan Multi-modal Embeddings, позволяя пользователям искать и находить товары с использованием текстов и изображений. Эта функция улучшает клиентский опыт, например, в мебельных магазинах, позволяя сопоставлять предметы через визуальный поиск.
3. Новые модели генерации текста: AWS запустила Titan TextLite и Titan TextExpress. TextLite отлично справляется с резюмированием и копирайтингом, тогда как TextExpress ориентирован на открытую генерацию текста, удовлетворяя различные потребности бизнеса.
4. Генератор изображений Titan: В предварительном просмотре этот инструмент создает реалистичные изображения на основе простых запросов с невидимыми водяными знаками для подлинности. Его продвинутые возможности, продемонстрированные на ключевой презентации, включают функции редактирования изображений, такие как "outpainting", обеспечивая плавную замену фонов.
5. Упрощенная генерация с использованием базы знаний (RAG): Новый KnowledgeBase для Amazon Bedrock упрощает процессы RAG, позволяя пользователям напрямую указывать свои LLM на источники данных и значительно снижая сложность настройки.
6. Инструменты оценки модели: AWS теперь предлагает предварительный просмотр инструмента оценки моделей на Amazon Bedrock, позволяя компаниям сравнивать и выбирать подходящие базовые модели в зависимости от своих потребностей.
7. Приложение DIY Agent (RAG DIY): Это инновационное приложение позволяет пользователям выполнять проекты с помощью запросов на естественном языке. Сивасубраманиан продемонстрировал, как оно помогает пользователям с подробными планами проектов и списками продуктов.
8. Центр инноваций Gen AI: AWS усиливает поддержку предприятий, предлагая экспертные консультации по созданию кастомизированных моделей, особенно вокруг моделей Claude от Anthropic.
9. Sagemaker Hyperpod: Теперь доступный для общего пользования, Hyperpod упрощает процесс обучения моделей, сокращая время до 40% и облегчая управление кластерами, позволяя компаниям сосредоточиться на своих инициативах в области ИИ без технических сложностей.
10. Улучшения интеграции баз данных: AWS устраняет барьеры между своими облачными базами данных, обеспечивая бесшовный доступ для LLM. Новые интеграции с Amazon OpenSearch и Amazon S3 позволяют осуществлять комплексный анализ данных без необходимости ETL-пайплайнов.
11. Векторный поиск для базы данных в памяти на Redis (предварительный просмотр): Эта функция предназначена для отраслей, нуждающихся в быстром векторном поиске, значительно помогая таким секторам, как финансовый.
12. Интеграция с Neptune Analytics: Это сочетание векторной и графовой аналитики позволяет предприятиям раскрывать более глубокие инсайты из взаимосвязанных данных до 80 раз быстрее.
13. Чистые комнаты для совместных моделей машинного обучения (предварительный просмотр): AWS позволит клиентам безопасно делиться данными в чистых комнатах, облегчая третий сторонный машинный интеллект для предсказательной аналитики.
14. Amazon Q для генеративного SQL: ИИ-ассистент, предназначенный для бизнеса, Amazon Q теперь может переводить запросы на естественном языке в SQL-запросы, максимизируя эффективность анализа данных в Amazon Redshift.
Эти анонсы подчеркивают приверженность AWS инновациям в генеративном ИИ, позиционируя компанию как серьезного конкурента в облачной среде и предлагая предприятиям надежную инфраструктуру для их ИИ-проектов.