Промежуточный уровень ИИ требует передовых аппаратных решений

Home Новости ИИ Промежуточный уровень ИИ требует передовых аппаратных решений

Updated on октябрь 25 2024

С увеличением стремления предприятий разрабатывать приложения и агенты искусственного интеллекта (ИИ) становится очевидной важность использования различных языковых моделей и баз данных для достижения оптимальных результатов.

Переход приложения с Llama 3 на Mistral может потребовать высокой технологической гибкости. Ключом к этому является уровень оркестрации, являющийся важным посредником, который связывает базовые модели с приложениями, управляя вызовами API для эффективного выполнения задач.

Этот уровень оркестрации в основном состоит из программных решений, таких как LangChain и LlamaIndex, которые облегчают интеграцию баз данных. Однако возникает важный вопрос: является ли этот уровень строго программным или оборудование играет значительную роль помимо простой поддержки ИИ моделей?

Ответ ясен: оборудование имеет решающее значение для поддержки таких платформ, как LangChain, а также для баз данных, на которых строятся приложения ИИ. Предприятиям необходимы мощные аппаратные стеки, способные управлять потоками больших объемов данных, при этом учитывая устройства, которые могут выполнять значительные задачи в дата-центрах на месте.

«Хотя промежуточный уровень ИИ в первую очередь программный, поставщики оборудования могут значительно влиять на его производительность и эффективность», – говорит Скотт Гнау, руководитель платформ данных в InterSystems.

Эксперты в области ИИ-инфраструктуры подчеркивают, что, хотя программное обеспечение является основой для оркестрации ИИ, его эффективность зависит от способности серверов и графических процессоров (GPU) обрабатывать большие объемы данных. Следовательно, для оптимального функционирования уровня оркестрации основное оборудование должно быть умным и эффективным, сосредоточенным на соединениях с высокой пропускной способностью и низкой задержкой для управления тяжелыми нагрузками.

«Этот уровень оркестрации требует быстрых процессоров», – поясняет Мэтт Кэнди, управляющий партнер по генеративному ИИ в IBM Consulting. «Я вижу будущее, где кремний, микросхемы и серверы могут оптимизироваться в зависимости от типа и размера модели, так как уровень оркестрации динамически переключается между задачами».

Существующие GPU уже могут эффективно поддерживать эти потребности.

Джон Роуз, глобальный технический директор и главный по ИИ в Dell, отмечает: «Это вопрос как аппаратного, так и программного обеспечения. Люди часто забывают, что ИИ проявляется как программное обеспечение, которое работает на аппаратном обеспечении. Программное обеспечение ИИ – это самое требовательное, что мы когда-либо создавали, и требует понимания метрик производительности и вычислительных требований».

Хотя уровень ИИ требует быстрого и мощного оборудования, новое специализированное оборудование не является необходимым помимо существующих GPU и микросхем.

«Конечно, оборудование является необходимым элементом, но я сомневаюсь, что существует специализированное оборудование, которое приведет к значительным прорывам, кроме GPU для повышения производительности модели», – заметил Гнау. «Оптимизация будет исходить от программного обеспечения и архитектуры с минимизацией перемещения данных».

Появление агентов ИИ усилило необходимость укрепления этого промежуточного уровня. Поскольку агенты ИИ общаются друг с другом и инициируют множество вызовов API, эффективный уровень оркестрации жизненно важен для управления этим трафиком с помощью быстрых серверов.

«Этот уровень обеспечивает бесперебойный доступ к API для всех типов моделей и технологий ИИ, улучшая общий пользовательский опыт», – говорит Кэнди. «Я называю его контроллером ИИ в стеке промежуточного программного обеспечения».

Агенты ИИ являются актуальной темой в индустрии и, вероятно, будут определять развитие инфраструктуры ИИ в ближайшие годы.

Роуз добавляет еще одно соображение для предприятий: локальный ИИ в устройствах. Компаниям необходимо планировать сценарии, где агентам ИИ нужно будет работать локально, особенно при потере соединения.

«Критический вопрос заключается в том, где происходят операции», – предлагает Роуз. «Именно здесь вступают в игру концепции, такие как AI PC. Когда группа агентов сотрудничает от вашего имени, нужно ли им всем быть централизованными?»

Он обсуждает исследование Dell в области «консьерж» агентов, которые поддерживают работу даже во время отсутствия интернета.

Генеративный ИИ способствовал взрыву в стеке технологий, так как новые поставщики услуг начинают предлагать пространство на GPU, базы данных и услуги AIOps. Однако это расширение может быть не постоянным, предостерегает генеральный директор Uniphore Уmesh Sachdev.

«Хотя стек технологий взорвался, я считаю, мы увидим фазу нормализации», – предсказывает Sachdev. «В конечном итоге организации будут консолидировать ресурсы внутри, и спрос на GPU стабилизируется. Увеличение слоев и поставщиков характерно для новых технологий, и мы увидим аналогичные тенденции с ИИ».

Для предприятий лучшей практикой является рассмотрение всей экосистемы ИИ – от аппаратного до программного обеспечения – для обеспечения эффективных рабочих процессов ИИ.

Google анонсирует запуск автоматизаций на базе Gemini для Google Workspace в следующем месяце.

Какой ключевой инфраструктурой необходимо обеспечить ваше предприятие для внедрения ИИ?

Most people like

Moontower

35.1K

Представляем окончательный монитор волатильности для трейдеров опционов: комплексный инструмент кросс-активного анализа, созданный для улучшения вашей торговой стратегии и принятия решений. Оставайтесь в курсе событий с помощью аналитики в реальном времени о колебаниях рынка в различных классах активов, что позволит вам эффективно использовать возможности и смягчать риски.

волатильность AI Analytics Assistant

Vectra AI

148.6K

Представляем нашу платформу ИИ, разработанную для обнаружения угроз в реальном времени и реагирования на них. Благодаря продвинутым алгоритмам и возможностям машинного обучения она быстро выявляет потенциальные угрозы безопасности и обеспечивает оперативное реагирование. Оставайтесь впереди киберугроз и эффективно защищайте свои цифровые активы с помощью нашей передовой технологии.

Кибербезопасность AI Analytics Assistant

AIFlowChart.io

70.4K

Легко создавайте диаграммы потоков прямо из вашего текста!

Схема потока AI Diagram Generator

Centralize

Раскройте потенциал нашей платформы ИИ для корпоративных продаж, созданной для предоставления ценной контактной информации и ускорения процесса заключения сделок. С углубленной аналитикой и умными инсайтами под рукой оптимизируйте свою стратегию продаж и добивайтесь более высоких конверсий. Узнайте, как наша платформа может преобразить ваши усилия в продажах уже сегодня!

На базе ИИ Sales Assistant

Find AI tools in YBX