Перейти к основному содержанию

Четыре GPU NVIDIA A100 в SuperWorkstation

Supermicro GPU SuperWorkstation 7049GP-TRT

Не так давно мы собирали бюджетный вариант сервера с двумя GPU на базе Supermicro.

Два GPU NVIDIA A100 в SuperWorkstation

NVIDIA A100 80GB PCIe

Использовали сервер Supermicro GPU SuperWorkstation 7049GP-TRT. В сервер можно установить до 4 больших GPU 10.5' двойной ширины. Для GPU с пассивным охлаждением может понадобиться комплект вентиляторов MCP-320-74702-0N-KIT, мне не понадобился. Особенности:

  • Два процессора (LGA 3647), поддержка процессоров 2nd Gen Intel Xeon Scalable (Cascade Lake/Skylake)
  • 16 DIMMs; до 4TB 3DS ECC DDR4-2933MHz RDIMM/LRDIMM, поддержка Intel Optane DCPMM
  • PCIe
    • 4 PCI-E 3.0 x16 (double-width) slots
    • 2 PCI-E 3.0 x16 (single-width) slots\
    • 1 PCI-E 3.0 x4 (in x8) slot
  • 8 Hot-swap 3.5" drive bays
  • 2x 10GBase-T LAN ports
  • 1 VGA, 2 COM, 5 USB 3.0
  • Охлаждение
    • 4 внутренних вентилятора
    • 2 радиатора на процессоры с управляемыми вентиляторами
    • 2 вытяжных вентилятора
    • 2 опциональных вентилятора для пассивных GPU

Для начала мы устанавливали две карты A100, соответственно, понадобился только один процессор. Теперь пришла пора добавить еще две карты A100, нам также понадобится второй процессор и память.

Краткая спецификация NVIDIA A100 80GB PCIe

  • Product SKU
    • P1001 SKU 230
    • NVPN: 699-21001-0230-xxx
  • Total board power
    • 300 W default
    • 300 W maximum
    • 150 W minimum
  • Thermal solution: Passive
  • Mechanical Form Factor: Full-height, full-length (FHFL) 10.5”, dual-slot
  • GPU SKU: GA100-893FF, GA100-893FFF, GA100-893HH, GA100-893HHH
  • PCI Express interface: PCI Express 4.0 ×16
  • Power connectors and headers: One CPU 8-pin auxiliary power connector

Питание GPU

Расположение разъёма питания:

gpu

Апгрейдим сервер

Берём с собой память, столько же, сколько сейчас установлено на одном процессоре.

gpu

Второй процессор.

gpugpugpu

И сами видеокарты.

nvidia

Не забываем комплект вентилятора с радиатором охлаждения от шасси сервера.

supermicro

Сервер нужно обесточить и извлечь из стойки. Работать следует вдвоём.

gpu

Снимаем крышку, проводим осмотр. В сервере, как и ожидалось, установлен один процессор и пара GPU.

gpu

Готовимся к работе.

gpu

Снимаем мешающие фиксирующие скобы.

gpu

На втором сокете установлена заглушка. Не снимайте её, если не планируете ставить процессор. 

gpu

Снимаем заглушку.

gpu

Перед установкой процессора чищу его спиртом.

gpu

Устанавливаем процессор в сокет. По инструкции положено устанавливать процессор в пластиковую скобу и пристёгивать к радиатору, но в данной модели сервера радиатор можно установить двумя способами: правильным и неправильный. Поэтому я предпочитаю устанавливать радиатор на процессор, он прилипнет, а потом уже пристёгивать и закреплять скобу.

gpu

Устанавливаем память, потом будет сложно подлезть.

gpu

Достаём вентилятор.

gpu

Теперь подключим вентилятор к материнской плате. Да, по инструкции это нужно делать потом, но... не подлезешь.

gpu

Питание вентилятора подключено.

gpu

Сам вентилятор пока пусть повисит в сторонке.

gpu

Устанавливаем пластиковую скобу на процессор. Тоже можно было бы заранее сделать, но без разницы, мне так удобнее.

gpu

Готовим радиатор. Заводская термопаста уже нанесена.

gpu

И внимательно устанавливаем радиатор, точно так же, как установлен первый.

gpu

Ниже на фото показано как можно ошибиться, не делайте так. При такой установке вентиляторы начинают дуть друг на друга.

gpu

Поэтому разворачиваем как нужно и приклеиваем к процессору. Если забыли поставить память, то радиатор можно извлечь вместе с процессором и плотно подогнать пластикувую направляющую, заодно память поставить.

gpu

Устанавливаем радиатор правильной стороной.

gpu

Затягиваем винты в порядке, указанном на радиаторе.

gpu

Понадобится длинный шестигранник.

gpu

Заранее подберите его перед поездкой.

gpu

На радиатор устанавливаем вентилятор и закрепляем винтом.

gpu

Подготавливаем пространство для GPU, снимаем заглушки.

gpu

Снимаем с видеокарт защитные плёнки.

gpu

Устанавливаем видеокарты и подключаем питание. Переходники не понадобятся.

gpu

Заранее распределите кабели питания, они разной длины.

gpu

Укладываем кабели питания, при необходимости фиксируем стяжками.

gpu

Закрепляем GPU винтами и защёлками.

gpu

Красота.

gpu

Устанавливаем обратно фиксирующую планку и закрепляем GPU.

gpu

Фиксаторы туго удерживают карты резиновыми наконечниками.- Особенно полезно при вертикальной установке корпуса.

gpu

Всё собрано.

gpu

Закрываем крышку.

gpu

Готовим рельсы, убираем мешающие кабели.

gpu

Устанавливаем сервер в стойку.

gpu

И радуемся хорошо выполненной работе. Не забываем включить сервер и проверить работоспособность системы. 

Ссылки

Четыре GPU на SuperWorkstation, йо-хо-хо, и два NV-Link!

Цены

 

Похожие материалы

Установка FC адаптера в сервер Supermicro SYS-2029U-TN24R4T

Здравствуй, юный сисадмин. Сегодня мы с тобой будем устанавливать два Fibre Channel адаптера в сервер Supermicro SYS-2029U-TN24R4T. Вернее, ставить буду я. А ты будешь, попивая пивко, на это смотреть.