Новости Компютерных технологий

"Сверхмощные системы HPE Cray EX: революция в области высокопроизводительных вычислений"

11/13/2024 13:19:53

В мире высоких технологий и вычислительной мощности постоянно происходят изменения, и последние разработки от HPE и Cray демонстрируют, насколько далеко продвинулись современные технологии. В преддверии конференции Super Computing в Атланте компания HPE представила свою новую систему EX154n, которая обещает стать настоящим прорывом в сфере высокопроизводительных вычислений (HPC), а также искусственного интеллекта (ИИ) и машинного обучения (ML).

Графические процессоры нового уровня

Платформа EX154n от Cray поддерживает до 224 графических процессоров Nvidia Blackwell и 8064 процессорных ядер Grace на каждый шкаф. Это означает, что система способна обеспечить более 10 петафлопс при FP64 для традиционных HPC-приложений и свыше 4,4 экзафлопсов при FP4 для разреженных рабочих нагрузок ИИ и ML, где высокая точность не всегда критична.

Каждый ускоритель EX154n оснащён парой суперчипов Grace Blackwell (GB200) мощностью 2,7 кВт, состоящих из двух графических процессоров Blackwell и одного 72-ядерного процессора Arm. Суперчипы соединяются между собой через эталонную конфигурацию NVL4 от Nvidia. При этом общая мощность потребления энергии одной стойки может достигать более 300 кВт.

Жидкостное охлаждение и отсутствие вентиляторов

Для охлаждения таких мощных систем применяется жидкостная технология, что является обязательным условием для поддержания стабильной работы. Более того, вся система EX154n полностью лишена вентиляторов, включая новые сетевые карты Ethernet, кабели и коммутаторы Slingshot 400. Эта инновационная сеть обеспечивает пропускную способность до 400 Гбит/с, что соответствует современным стандартам Ethernet и InfiniBand.

Семейство сетей Slingshot

Slingshot 400 является преемником предыдущей версии Slingshot, значительно улучшая её характеристики. Предыдущие сети Slingshot использовались в крупных суперкомпьютерах, таких как Frontier, Aurora и Lumi, демонстрируя надёжность и эффективность. Однако, несмотря на все преимущества новой системы, её выпуск запланирован только на конец 2025 года.

Традиционные HPC-системы на базе ЦП

Тем временем, те пользователи, которым нужны традиционные HPC-решения на базе центральных процессоров (ЦП), могут обратить внимание на вычислительные блейды Cray пятого поколения EX4252 Gen 2 на базе Epyc, которые появятся уже весной следующего года. Они смогут вместить до восьми 192-ядерных процессоров Turin-C, обеспечивая в сумме 98 304 ядра на шкаф.

Обновлённые системы хранения данных

Кроме того, Cray начнёт поставки обновлённых систем хранения данных E2000, которые обещают более чем вдвое повысить производительность ввода-вывода за счёт использования более быстрого хранилища NVMe на базе PCIe 5.0. Поставка этих массивов хранения данных планируется на начало 2025 года.

Новые вычислительные серверы ProLiant

Однако не стоит забывать, что такие мощные системы, как EX154n, требуют специальных условий эксплуатации и вряд ли подойдут для обычного центра обработки данных. Для тех, кому нужна мощь, но без необходимости сложного технического обслуживания, HPE предлагает новые вычислительные серверы серии ProLiant с воздушным охлаждением. Эти системы используют знакомую многим систему управления iLO, предназначенную для предприятий.

Серверы XD680 и XD685

Новые серверы XD680 поставляются с восемью ускорителями Intel Gaudi3 общей ёмкостью 1 ТБ HBM2e. Каждый такой ускоритель способен обеспечивать 1,8 петафлопс высокой производительности BF16, что делает их весьма конкурентоспособными среди современных решений.

Сервер XD685 предоставляет выбор между восемью Nvidia H200 с общим объёмом 1,1 ТБ HBM3e или будущими графическими процессорами Blackwell, которые увеличат объём памяти до 1,5 ТБ.

Заключение

Системы HPE Cray EX представляют собой новый уровень вычислительной плотности и мощности, который открывает перед разработчиками и исследователями огромные возможности. Благодаря использованию самых современных технологий, таких как графические процессоры Nvidia Blackwell и Grace, жидкостное охлаждение и высокоскоростные сети Slingshot, эти решения станут незаменимыми инструментами для выполнения сложных задач в области науки, инженерии и искусственного интеллекта.

Загрузка..

An unhandled error has occurred. Перезагрузить 🗙