Ампер Компьютинг расширяет семью процессоров и сосредотачивается на эффективности ИИ
Ампер Компьютинг объявила о расширении своей семейства чипов AmpereOne до 256 ядер к следующему году. Компания также сотрудничает с Qualcomm для разработки облачных ИИ-ускорителей.
По словам Джеффа Уиттича, директора по продуктам, новый централизованный процессор (ЦП) обеспечит на 40% больше производительности, чем любой другой ЦП на сегодняшний день.
Сотрудничество с Qualcomm
Компания Ampere, расположенная в Санта-Кларе, Калифорния, объединяется с Qualcomm Technologies для создания решения для ИИ-инференции, используя высокопроизводительные и энергоэффективные решения Cloud AI 100 от Qualcomm вместе с процессорами Ampere.
Генеральный директор Ampere Рене Джеймс подчеркнула актуальные энергетические проблемы, вызванные развитием ИИ. "Мы начали этот путь шесть лет назад, потому что осознали его важность," — отметила Джеймс. "Низкое энергопотребление больше не означает низкой производительности. Ampere переопределила границы эффективности вычислений, обеспечивая превосходную производительность в рамках эффективной архитектуры."
Проблема энергоэффективности дата-центров
Энергопотребление дата-центров становится все более актуальной проблемой. Джеймс отметила, что резкий переход к ИИ усиливает энергетические вызовы в отрасли. "Текущая траектория неустойчива. Будущие инфраструктуры дата-центров должны модернизировать существующие системы с воздушным охлаждением и строить экологически устойчивые новые объекты, совместимые с доступностью сетевой энергии," — добавила она.
Уиттич поддержал эту точку зрения, указав, что необходимость создания нового ЦП была вызвана ростом потребления энергии в дата-центрах, особенно из-за ИИ. “Крайне важно разработать решения, которые повысят эффективность в области общей вычислительной мощности и ИИ,” — добавил Уиттич.
Видение Ampere в области ИИ
Ampere разрабатывает комплексный подход под названием “ИИ-вычисления,” который объединяет облачные возможности и функциональность ИИ. "Наши ЦП могут поддерживать широкий спектр задач — от популярных облачных приложений до ИИ, интегрируя ИИ в традиционные приложения, такие как обработка данных и доставка медиа," — объяснил Уиттич.
Дорожная карта на будущее
Ampere установила амбициозную дорожную карту для своих ЦП для дата-центров. Ключевые предстоящие разработки включают 12-канальный ЦП на 256 ядер, производимый с использованием технологии TSMC N3. Ранее анонсированный 192-ядерный ЦП уже в производстве и доступен на рынке.
Ampere и Qualcomm сотрудничают для улучшения общего решения с использованием ЦП Ampere и Qualcomm Cloud AI 100 Ultra, нацеливаясь на инференцию крупных языковых моделей (LLM) в генеративном ИИ.
Уиттич охарактеризовал их партнерство как приверженность созданию высокоэффективных ЦП, оптимизированных для ИИ-приложений. “Это решение упростит внедрение для клиентов и предоставит инновационные возможности для ИИ-инференции,” — отметил он.
Увеличение производительности
С расширением 12-канальной платформы, включая новый 256-ядерный ЦП AmpereOne, пользователи могут ожидать значительного увеличения производительности без сложных дизайнов. Существующая 192-ядерная модель остается на пути к запуску позже в этом году, демонстрируя эволюцию с восьми до двенадцати каналов памяти.
Отметим, что технологии ЦП Ampere уже используются в Llama 3 от Meta в Oracle Cloud. Выдающе, что Llama 3 работает на 128-ядерном ЦП Ampere Altra без GPU, обеспечивая сопоставимость с комбинацией Nvidia A10 GPU и x86 CPU при потреблении всего лишь одной трети энергии.
Рабочая группа UCIe и конкурентное преимущество
Совсем недавно Ampere создала рабочую группу UCIe в рамках Альянса ИИ Платформы, чтобы увеличить гибкость своих ЦП, позволяя интегрировать клиентские IP в будущие дизайны.
Ampere конкурирует напрямую с AMD, подчеркивая свои преимущества в производительности. ЦП AmpereOne лидируют по отношению производительности к потребляемой энергии, превосходя AMD Genoa на 50% и Bergamo на 15%. Для дата-центров, стремящихся обновить инфраструктуру, AmpereOne может обеспечить на 34% больше производительности на стойку.
Новые платформы AmpereOne OEM и ODM будут доступны в ближайшие месяцы.
Кроме того, Ampere сотрудничает с NETINT для разработки решения с использованием их видеопроцессоров Quadra T1U, позволяющего одновременное транскодирование 360 живых каналов и реальное субтитрование для 40 потоков, используя модель Whisper от OpenAI.
Ampere стремится стать основой вычислений в эпоху ИИ. Недавние улучшения, включая функции, такие как тегирование памяти, обеспечение качества обслуживания (QOS) и управление перегрузкой сетей, culminate в введении функции FlexSKU, позволяющей клиентам использовать один и тот же SKU как для масштабируемых, так и для увеличивающихся случаев использования.
Сотрудничая с Oracle, Ampere успешно снизила операционные расходы на 28%, используя всего треть энергии, необходимой конкурентным решениям от Nvidia. Этот подход позволяет пользователям работать с 15% меньшим количеством серверов, занимая на 33% меньше места в стойке и сократив потребление энергии на 35%, что соответствует обязательству Ampere к эффективности и производительности в вычислениях ИИ.