Новая парадигма вычислений с суперкластерами Supermicro с жидкостным охлаждением

3:14, 17.10.2024

Supermicro, Inc., поставщик комплексных ИТ-решений для ИИ, облачных вычислений, хранения данных и 5G/Edge, ускоряет переход отрасли на центры обработки данных с жидкостным охлаждением с помощью платформы NVIDIA Blackwell, чтобы обеспечить новую парадигму энергоэффективности для быстро растущего спроса на энергию новых инфраструктур для ИИ. Ведущие в отрасли комплексные решения Supermicro с жидкостным охлаждением основаны на платформе NVIDIA GB200 NVL72 для эксафлопсных вычислений в одной стойке и уже начат отбор клиентов для полномасштабного производства в конце четвертого квартала. Кроме того, недавно анонсированные системы с жидкостным охлаждением Supermicro X14 и H14 4U, а также системы воздушного охлаждения 10U готовы к производству для системы NVIDIA HGX B200 8-GPU.

«Мы управляем будущим устойчивых вычислений для ИИ, и наши решения для ИИ с жидкостным охлаждением быстро внедряются в одни из самых амбициозных проектов ИИ-инфраструктуры в мире с более чем 2 000 стоек с жидкостным охлаждением, поставленных с июня 2024 года», – сказал Чарльз Лян (Charles Liang), президент и главный исполнительный директор Supermicro. «Комплексное решение Supermicro с жидкостным охлаждением на базе платформой NVIDIA Blackwell открывает вычислительную мощность, экономичность и энергоэффективность графических процессоров следующего поколения, таких как те, которые являются частью NVIDIA GB200 NVL72, эксафлопсного компьютера, содержащегося в одной стойке. Обширный опыт Supermicro в развертывании инфраструктуры для ИИ с жидкостным охлаждением, а также комплексные услуги на местах, программное обеспечение для управления и глобальные производственные мощности дают клиентам явное преимущество в преобразовании центров обработки данных с помощью самых мощных и устойчивых решений для ИИ». 

Суперкластеры SuperClusters Supermicro с жидкостным охлаждением для систем на базе платформы NVIDIA GB200 NVL72 оснащены новыми усовершенствованными блоками распределения охлаждающей жидкости (CDU) в стойке или в ряд, а также специальными холодными пластинами, предназначенными для вычислительного лотка, на котором размещены два суперчипа NVIDIA GB200 Grace Blackwell в форм-факторе 1U. NVIDIA GB200 NVL72 от Supermicro предоставляет эксафлопсные вычислительные возможности для ИИ в одной стойке с комплексным решением Supermicro с жидкостным охлаждением. Стоечное решение включает в себя 72 графических процессора NVIDIA Blackwell и 32 процессора NVIDIA Grace, соединенных между собой сетью NVLink от NVIDIA пятого поколения. Система NVIDIA NVLink Switch обеспечивает скорость 130 терабайт в секунду (ТБ/с) общей связи с графическим процессором с чрезвычайно низкой задержкой, повышая производительность для рабочих нагрузок ИИ и высокопроизводительных вычислений (HPC). Кроме того, Supermicro поддерживает недавно анонсированную платформу NVIDIA GB200 NVL2, систему с воздушным охлаждением 2U с плотно связанными двумя графическими процессорами NVIDIA Blackwell и двумя процессорами NVIDIA Grace, которые подходят для простого развертывания с различными рабочими нагрузками, такими как большой логический вывод LLM, RAG, обработка данных и HPC-приложения.

Ведущие системы Supermicro 4U с жидкостным охлаждением и новые системы 10U с воздушным охлаждением теперь поддерживают систему NVIDIA HGX B200 8-GPU и готовы к производству. Недавно разработанные охлаждающие пластины и блок распределения охлаждающей жидкости в стойке мощностью 250 кВт максимизируют производительность и эффективность систем 8-GPU, обеспечивая 64 графических процессора NVIDIA Blackwell мощностью 1 000 Вт и 16 процессоров мощностью 500 Вт в одной стойке 48U. До 4 новых систем с воздушным охлаждением 10U могут быть установлены и полностью интегрированы в стойку той же плотности, что и предыдущее поколение, обеспечивая при этом в 15 раз больше логического вывода и 3-кратную производительность обучения.

Программное обеспечение SuperCloud Composer, комплексная платформа управления центрами обработки данных Supermicro, предоставляет мощные инструменты для мониторинга важной информации о системах и стойках с жидкостным охлаждением, распределительных устройствах охлаждающей жидкости и градирнях, включая давление, влажность, состояние насосов и клапанов и многое другое. Модуль SuperCloud Composer Liquid Cooling Consult (LCCM) оптимизирует эксплуатационные расходы и управляет целостностью центров обработки данных с жидкостным охлаждением.

Масштабируя инфраструктуру для моделей ИИ с несколькими триллионами параметров, Supermicro находится на переднем крае внедрения сетевых инноваций как для InfiniBand, так и для Ethernet, включая NVIDIA BlueField®-3 SuperNIC и NVIDIA ConnectX®-7 со скоростью 400 Гбит/с, NVIDIA ConnectX®-8, Spectrum™-4 и NVIDIA Quantum-3, чтобы обеспечить сеть 800 Гбит/с для платформы NVIDIA Blackwell. NVIDIA Spectrum-X™ Ethernet с системными кластерами NVIDIA HGX H100 и H200 с жидкостным охлаждением 4U и воздушным охлаждением 8U от Supermicro теперь обеспечивает одно из крупнейших развертываний ИИ на сегодняшний день. 

От проверки концепции (PoC) до полномасштабного развертывания, Supermicro – это универсальный магазин, предоставляющий все необходимые технологии, жидкостное охлаждение, сетевые решения и услуги по установке на местах. Supermicro предоставляет комплексную, разработанную собственными силами экосистему жидкостного охлаждения, включающую специально разработанные холодные пластины, оптимизированные для различных графических процессоров, центральных процессоров и модулей памяти, а также с многочисленными форм-факторами и ёмкостью CDU, коллекторами, шлангами, разъемами, градирнями, а также программное обеспечение для мониторинга и управления. Это комплексное решение легко интегрируется в конфигурации стоечного уровня, значительно повышая эффективность системы, смягчая тепловое дросселирование и одновременно снижая совокупную стоимость владения (TCO) и воздействие на окружающую среду операций центра обработки данных в эпоху ИИ.