
Всем привет, сегодня мы ставим четыре видеокарты NVIDIA A100 80GB PCIe в сервер ASUS ESC4000-E10.
NVIDIA A100
GPU NVIDIA A100 с тензорными ядрами обеспечивает беспрецедентное ускорение на всех уровнях, поддерживая непревзойденное ускорение для нагрузок ИИ, аналитики данных и высокопроизводительных вычислений (HPC).
Для поддержки NVLINK необходима установка карт попарно рядом.
- Всего NVLink bridges поддерживает NVIDIA A100 80G: 3
- Всего NVLINK Rx и Tx линий поддерживается: 96
- Передача данных NVIDIA A100 80GB по линии NVLink (в каждом направлении): 50 Gbps
- Максимальная пропускная способность NVLink bandwidth: 600 ГБ/с
В качестве мостов используются 2-slot NVLink Bridge для NVIDIA A100 80GB PCIe part number: 900-53651-0000-000. На каждую пару ускорителей требуется три моста.
Краткая спецификация:
- Product SKU
- P1001 SKU 230
- NVPN: 699-21001-0230-xxx
- Total board power
- 300 W default
- 300 W maximum
- 150 W minimum
- Thermal solution: Passive
- Mechanical Form Factor: Full-height, full-length (FHFL) 10.5”, dual-slot
- GPU SKU: GA100-893FF, GA100-893FFF, GA100-893HH, GA100-893HHH
- PCI Express interface: PCI Express 4.0 ×16
- Power connectors and headers: One CPU 8-pin auxiliary power connector
Расположение разъёма питания:
ASUS ESC4000-E10
ASUS ESC4000 G3 – это двухпроцессорный графический сервер на базе процессоров Intel Xeon Scalable 3-го поколения, которые обладают большей плотностью ядер по сравнению с предыдущим поколением (в двухпроцессорной конфигурации). Высокая производительность и энергоэффективность, гибкие возможности расширения конфигурации и продуманная система охлаждения делают его идеальным выбором для профессиональных приложений.
Функции:
- 4 слота PCIe 4.0 x16 – для двухслотовых видеокарт или 8 слотов PCIe 4.0 x8 – для однослотовых видеокарт
- 3 слота PCIe Gen4 для низкопрофильных сетевых адаптеров или других карт расширения
- 8 отсеков для горячей замены 3,5"/2,5" накопителей (поддержка до 8 NVMe-дисков)
- Слот OCP 3.0 Mezzanine для гибкости в настройке сетевых подключений (опционально)
- ASUS ESC4000-E10 оснащен встроенным модулем ASMB10-iKVM (BMC на базе AST2600) и поставляется с ASUS Control Center, обеспечивая полный набор функций out-of-band и in-band управления.

Установка GPU
Убедимся, что у нас имеются кабели питания для GPU.

Открываем сервер, извлекаем райзеры для GPU.

Подключаем кабели питания.

Понадобятся два кабеля на каждый райзер.

В райзеры попарно устанавливаем видеокарты.

Не забываем удалить с видеокарт защитные плёнки.

Будем устанавливать райзеры.

Важный момент. Один из разъёмов NV-Link перекрыт рёбром жёсткости.

Вид на элемент конструкции изнутри.

Если вы планируете подключить NV-Link, то предварительно снимите эту деталь. Она фиксируется винтами.

Устанавливаем райзеры с A100 картами.

Сначала подключаем питание, затем поварачиваем райзер и устанавливаем.

Райзеры фиксируются винтами с задней стороны сервера.

И изнутри корпуса.

Райзеры установлены.

Основное подключили.

Собираем. Включаем. Проверяем.

Работает. Можно в продакшен.