Создание Масштабируемой Инфраструктуры ИИ: Внимание к Энергетической Эффективности
На недавней конференции Hot Chips 2024 Тревор Цай, руководитель аппаратной инфраструктуры OpenAI, выступил с ключевой речью на тему "Создание Масштабируемой Инфраструктуры ИИ". Цай подчеркнул, что масштабирование вычислительных ресурсов может значительно улучшить производительность и полезность искусственного интеллекта, что делает этот аспект критически важным для будущего развития ИИ.
Hot Chips — ключевая мировая конференция, посвященная достижениям в области процессоров и сопутствующих технологий. В этом году обсуждения вокруг искусственного интеллекта были особенно активными, особенно в свете растущих энергетических потребностей дата-центров. Исследования Morgan Stanley показывают, что потребление электроэнергии генеративным ИИ ожидается на уровне 75% ежегодного роста в ближайшие несколько лет, причем энергопотребление к 2026 году должно сопоставиться с общим потреблением Испании.
Наплыв Энергетически Эффективных Решений
В течение двух дней на мероприятии Hot Chips 2024 особое внимание было уделено внедрению энергоэффективных и масштабируемых серверов для ИИ. В своей речи Тревор Цай отметил, что с ростом вычислительных возможностей требуется значительное инвестирование в инфраструктуру ИИ для достижения ощутимых результатов. С 2018 года вычислительные требования для передовых моделей увеличились примерно в четыре раза. Если для обучения оригинальной модели GPT-1 требовалось всего несколько недель, то сейчас это требует обширных кластеров GPU.
IBM представила свой предстоящий процессор Telum II и ускоритель Spyre, хвастаясь новыми методами интеграции ИИ, направленными на снижение потребления энергии и физического объема. NVIDIA представила архитектуру AI-кластера Blackwell, способного обучать модели с использованием до 100 триллионов параметров, применяя систему квантования Quasar для минимизации энергозатрат. Другие компании, такие как Intel, Broadcom и SK Hynix, также представили решения в области энергоэффективных технологий, подчеркивая общую озабоченность растущими энергетическими потребностями.
Энергетические Потребности и Экологические Проблемы
Быстрое развитие искусственного интеллекта вызывает рост спроса на более мощные процессоры, что приводит к беспрецедентному энергопотреблению дата-центров. По данным Bloomberg, в прошлом году крупные технологические компании инвестировали колоссальные 105 миллиардов долларов в инфраструктуру дата-центров. Учитывая растущие вычислительные потребности для задач ИИ, Международное энергетическое агентство прогнозирует, что мировое энергопотребление дата-центров к 2026 году сравняется с потреблением электроэнергии Японии.
Саша Луччони, глава Hugging Face, отметила, что хотя обучение моделей ИИ обычно происходит в одном цикле, частые запросы приводят к увеличению энергопотребления. Например, один запрос к ChatGPT потребляет столько же энергии, сколько и работа лампочки в течение 20 минут. Этот спрос создает проблемы для энергетических ресурсов и вызывает экологические опасения.
В ответ на энергетический кризис технологические компании ищут более чистые источники энергии. Amazon инвестирует в ядерный дата-центр в Пенсильвании, чтобы уменьшить зависимость от традиционных электросетей. Тем временем Google разрабатывает специализированные чипы, оптимизированные для ИИ, что значительно повышает энергетическую эффективность.
Исследования NVIDIA показывают, что их система прямого жидкостного охлаждения может снизить энергопотребление дата-центров на 28%. Однако профессор Синклер из Университета Висконсина предупреждает, что, несмотря на повышение энергетической эффективности отдельных задач, общий рост использования все равно может привести к росту общего энергопотребления. Этот феномен, известный как Парадокс Джефонса, применяется как в исторической перспективе, так и в контексте современного развития ИИ.
Заключение
Быстрая эволюция технологий ИИ наряду с растущими энергетическими потребностями требует от технологических компаний поиска инновационных и устойчивых решений. Обсуждения на Hot Chips 2024 отражают общее внимание отрасли к энергоэффективным технологиям, указывая путь к будущему развитию инфраструктуры ИИ.