Перейти к основному содержанию

Четыре GPU на SuperWorkstation, йо-хо-хо, и два NV-Link!

Supermicro GPU SuperWorkstation 7049GP-TRT

У нас новый проект по апгрейду сервера, будем забивать корпус видеокартами. Типовая задачка для системного администратора.

Перед апгрейдом любого сервера нужно читать документацию, а потом ещё раз.

Менеджер проекта спрашивает разработчика: "почему система так долго выполняет расчёты"? "Так надо ещё пару видеокарт воткнуть, и мостом их соединить" - отвечает разработчик. "Отлично, купим две видеокарты и пару мостов. Потом дадим админам, чтобы вставили!"

Вот ТАК делать не надо.

Комплектующие для апгрейда-

Имеем сервер Supermicro GPU SuperWorkstation 7049GP-TRT, он поддерживает до 4 больших GPU 10.5' двойной ширины. Сейчас там стоит две видеокарты, сетевуха и всё это с одним процессором.

supermicro

Для того чтобы добавить ещё две видеокарты потребуется:

  • Две видеокарты с активным охлаждением: GIGABYTE GeForce RTX 3090 TURBO 24G
  • Второй процессор: Intel Xeon Silver 4210 CPU @ 2.20GHz
  • Кулер для процессора Supermicrо SNK-P0070APS4 (должен быть в комплекте с шасси)
  • Память для второго процессора: 128 Гб 2400 МГц
  • Четыре кабеля Supermicro CBL-PWEX-1040 (должны быть в комплекте с шасси)
  • Два моста NVLink Bridge Ampere (2-slot) (по желанию заказчика)

Процессор покупаем, он должен быть идентичным установленному.

cpu

Память тоже покупаем. Можно было отобрать пару планок у первого процессора, но бюджет позволяет.

memory

Кулер для процессора Supermicrо SNK-P0070APS4 был в комплекте, откопал в шкафу, покупать не придётся.

supermicro

Точно таких же видеокарт, которые уже стояли, в продаже не было, выбрали тоже с чипом GeForce RTX 3090, но от другого производителя. Видеокарта GIGABYTE GeForce RTX 3090 TURBO 24G с графическим процессором NVIDIA GeForce RTX 3090. Прекрасна она тем, что оснащена турбиной для активного охлаждения. Такое решение позволяет выводить горячий воздух за пределы системного блока, при этом сами размеры видеокарты вписываются в два PCIe слота.

Вот как раз ширина в два PCIe слота и была критерием выбора, иначе четыре GPU в такой сервер не установить.

video

Два моста NVLink Bridge Ampere (2-slot) тоже выбраны исходя из ширины устанавливаемых видеокарт.

nvlink

nvlink

Четыре кабеля Supermicro CBL-PWEX-1040 должны быть в комплекте с шасси, однако, их не было. Было только пару штук. Пришлось обратиться к поставщику по вопросу доукомплектации, а пока временно возьму два кабеля из заначки.

supermicro

По сусекам помели, набрали комплект для апгрейда сервера. Просто двух видеокарт недостаточно. Собираем всё и выдвигаемся в ЦОД.

supermicro

Апгрейд сервера

Работы предстоит много, поэтому планируем простой, часа на два. Сервер нужно будет снимать, установлен высоковато, удобнее будет опустить на пол.

supermicro

Выключаем сервер, извлекаем из стойки. Снимаем крышку.

supermicro

По фотографии всё и так понятно. Видеокарты придётся переставить, один NV-Link будем устанавливать на MSI карты, второй на Gigabyte, поэтому карты нужно будет сдвинуть.

supermicro

Да и сетевуху переставим, эту сборку делали поставщики, непонятно почему так всё поставили, сделаем так как нужно. Первая карта MSI занимает второй двойной PCIe слот и стоит на своём месте. Трогать её не будем.

supermicro

И почему я сразу в прошлый раз платы на место не поставил? Ну да ладно, у нас есть прекрасная возможность привести всё в порядок. Извлекаем сетевую карту, поставим её в самом конце в слот PCIe 3.0 x4 (in x8). Кстати, это у нас Supermicro AOC-STGN-i2S, что видно по прекрасному зелёному радиатору.

Supermicro AOC-STGN-i2S — обзор

supermicro

Переставляем вторую карту MSI в первый двойной PCIe слот. Соединяем карты мостом NV-Link. Ничего сложного в установке моста нет.

Установка NVLink Bridge

supermicro

Каждую видеокарту подключаем к питанию кабелем Supermicro CBL-PWEX-1040. Кабели уже были подключены к видеокартам, так что сложностей не возникло.

supermicro

Мы освободили немного пространства в корпусе, теперь будет удобно устанавливать второй процессор.

  • Processor: Intel Xeon Silver 4210 CPU @ 2.20GHz
  • Speed: 2200 MHz
  • Core: 10
  • Core Active: 10
  • Manufacturer: Intel Corporation

Supermicro GPU SuperWorkstation 7049GP-TRT — установка процессора

Перед началом установки изучаем все инструкции.

supermicro

На процессор понадобится охлаждение.

Кулер для процессора Supermicrо SNK-P0070APS4

Активный кулер с радиатором для корпуса Supermicro. Предназначен для серверов и рабочих станций общего назначения 4U поколения Supermicro X11, оснащенных масштабируемыми процессорами Intel Xeon. Радиатор был полностью протестирован и одобрен Supermicro. На радиатор уже нанесена термопаста.

supermicro

supermicro

cpu

Достаём из комплекта охлаждения монтажную рамку.

cpu

Вставляем в неё процессор. Инструкция имеется в комплекте охлаждения.

cpu

Устанавливаем процессор с планкой на радиатор.

cpu

На радиаторе уже имеется нанесённый заводской слой термопасты.

cpu

Снимаем заглeшку с сокета. На первом процессоре уже стоит радиатор, можно прикинуть что в итоге должно получиться.

cpu

Устанавливаем процессор в сокет. Внимательно следуем меткам в углу сокета, совмещая с треугольником на процессоре и планке.

cpu

Порядок затяжки болтов указан на радиаторе.

cpu

Понадобится длинный шестигранник или торкс. Затягиваем четыре болта.

cpu

Устанавливаем радиатор и закрепляем его болтом из комплекта охлаждения. Надпись "Air Flow Direction" подскажет, куда нужно направить ветер. Если сомневаемся, подглядываем как стоит кулер на первом процессоре.

cpu

Питание вентилятора подключаем к материнской плате. ? Помоги Даше найти разъём для подключения вентилятора на фото. ? Подсказка, он над слотами для DIMM.

cpu

Готовим память.

  • Max Capable Speed: 2933 MHz
  • Operating Speed: 2400 MHz
  • Size: 32768 MiB
  • Part No.: M393A4K40DB2-CVF
  • Manufacturer: Samsung

memory

Слоты подписаны на материнской плате.

dimm

Изучаем таблицу с порядком установки планок памяти. Мне нужен вариант 2 CPUs & 8 DIMMs. Собственно, устанавливаю как на первом процессоре.

cpu

cpu

Устанавливаем оперативную память.

cpu

С процессором закончили, теперь поставим вторую пару GPU.

supermicro

Перед установкой подключаем к каждой видеокарте кабель питания Supermicro CBL-PWEX-1040. После установки его тоже можно подключить, но очень неудобно.

supermicro

Устанавливаем GPU в третий и четвёртый двойные PCIe слоты.

supermicro

Подключаем питание.

supermicro

На вторую пару GPU устанавливаем мост NV-Link.

supermicro

Прекрасно.

supermicro

Почти всё собрано.

supermicro

Устанавливаем сетевую карту подальше от GPU в седьмой одинарный PCIe 3.0 x4 (in x8) слот. Возвращаем в неё трансиверы.

После того как мы включим сервер, нужно будет перенастроить сеть, потому как названия интерфейсов у сетевой карты изменятся. Там Ubuntu 18.04.5 LTS крутится.

supermicro

Закрываем сервер и устанавливаем обратно в стойку.

Проверка

Проверим, что железо определилось.

Процессор и память проверяю в BIOS. Потом загружаю ОС Ubuntu 18.04.5 LTS.

lspci | grep NVIDIA

supermicro

GPU определились. Проверим NV-Link.

nvidia-smi topo --matrix

supermicro

Топология верна.

Настраиваю сеть (слетели имена интерфейсов после перестановки карты) и выдвигаюсь домой. Мавр сделал своё дело, мавр может уходить.

Цены

 

Похожие материалы

Установка SFP+ адаптера в сервер Supermicro SYS-2029U-TN24R4T

Сервер Supermicro SYS-2029U-TN24R4T имеет 4 10G адаптера на борту, но они RJ45, что не всегда удобно. Установим дополнительную PCIe плату с SFP+ портами. 

Сервер Supermicro SYS-1029P-WTRT

Есть два подхода к выбору сервера. Можно выбрать сервер с учётом возможной расширяемости или роста определённого показателя: производительности, объёма оперативки или места на дисках. А можно выбрать сервер под определённую задачу. Первый способ более затратный, но с заделом на будущее. Второй — оптимальный по затратам, но почти без возможности роста.

День, когда я менял диски

Сегодня не самый обычный пост, я еду в ЦОД менять и устанавливать диски. Любопытно, что все диски разные, оборудование тоже разное. Для мониторинга состояния дисков потребуется самые разные инструменты. Вроде бы всего 4 диска, а подходы самые разные. Поехали.