Перейти к основному содержанию

Четыре GPU NVIDIA A100 в сервер ASUS ESC4000-E10

NVIDIA A100

Всем привет, сегодня мы ставим четыре видеокарты NVIDIA A100 80GB PCIe в сервер ASUS ESC4000-E10.

NVIDIA A100

GPU NVIDIA A100 с тензорными ядрами обеспечивает беспрецедентное ускорение на всех уровнях, поддерживая непревзойденное ускорение для нагрузок ИИ, аналитики данных и высокопроизводительных вычислений (HPC).

Для поддержки NVLINK необходима установка карт попарно рядом.

nvlink

  • Всего NVLink bridges поддерживает NVIDIA A100 80G: 3
  • Всего NVLINK Rx и Tx линий поддерживается: 96
  • Передача данных NVIDIA A100 80GB по линии NVLink (в каждом направлении): 50 Gbps
  • Максимальная пропускная способность NVLink bandwidth: 600 ГБ/с

В качестве мостов используются 2-slot NVLink Bridge для NVIDIA A100 80GB PCIe part number: 900-53651-0000-000. На каждую пару ускорителей требуется три моста.

nvidia

Краткая спецификация:

  • Product SKU
    • P1001 SKU 230
    • NVPN: 699-21001-0230-xxx
  • Total board power
    • 300 W default
    • 300 W maximum
    • 150 W minimum
  • Thermal solution: Passive
  • Mechanical Form Factor: Full-height, full-length (FHFL) 10.5”, dual-slot
  • GPU SKU: GA100-893FF, GA100-893FFF, GA100-893HH, GA100-893HHH
  • PCI Express interface: PCI Express 4.0 ×16
  • Power connectors and headers: One CPU 8-pin auxiliary power connector

Расположение разъёма питания:

gpu

ASUS ESC4000-E10

ASUS ESC4000 G3 – это двухпроцессорный графический сервер на базе процессоров Intel Xeon Scalable 3-го поколения, которые обладают большей плотностью ядер по сравнению с предыдущим поколением (в двухпроцессорной конфигурации). Высокая производительность и энергоэффективность, гибкие возможности расширения конфигурации и продуманная система охлаждения делают его идеальным выбором для профессиональных приложений.

Функции:

  • 4 слота PCIe 4.0 x16 – для двухслотовых видеокарт или 8 слотов PCIe 4.0 x8 – для однослотовых видеокарт
  • 3 слота PCIe Gen4 для низкопрофильных сетевых адаптеров или других карт расширения
  • 8 отсеков для горячей замены 3,5"/2,5" накопителей (поддержка до 8 NVMe-дисков)
  • Слот OCP 3.0 Mezzanine для гибкости в настройке сетевых подключений (опционально)
  • ASUS ESC4000-E10 оснащен встроенным модулем ASMB10-iKVM (BMC на базе AST2600) и поставляется с ASUS Control Center, обеспечивая полный набор функций out-of-band и in-band управления.
asus

Установка GPU

Убедимся, что у нас имеются кабели питания для GPU.

asus

Открываем сервер, извлекаем райзеры для GPU.

asus

Подключаем кабели питания.

asus

Понадобятся два кабеля на каждый райзер.

asus

В райзеры попарно устанавливаем видеокарты.

asus

Не забываем удалить с видеокарт защитные плёнки.

asus

Будем устанавливать райзеры.

asus

Важный момент. Один из разъёмов NV-Link перекрыт рёбром жёсткости.

asus

Вид на элемент конструкции изнутри.

asus

Если вы планируете подключить NV-Link, то предварительно снимите эту деталь. Она фиксируется винтами.

asus

Устанавливаем райзеры с A100 картами.

asus

Сначала подключаем питание, затем поварачиваем райзер и устанавливаем.

asus

Райзеры фиксируются винтами с задней стороны сервера.

asus

И изнутри корпуса.

asus

Райзеры установлены.

asus

Основное подключили.

asus

Собираем. Включаем. Проверяем.

asus

Работает. Можно в продакшен.

Цены

 

Похожие материалы

Четыре GPU NVIDIA A100 в SuperWorkstation

Для начала мы устанавливали две карты A100, соответственно, понадобился только один процессор. Теперь пришла пора добавить еще две карты A100, нам также понадобится второй процессор и память.