Перейти к основному содержанию

День, когда я менял диски

Мастерская

Один день с админом.

Сегодня не самый обычный пост, я еду в ЦОД менять и устанавливать диски. Любопытно, что все диски разные, оборудование тоже разное. Для мониторинга состояния дисков потребуется самые разные инструменты. Вроде бы всего 4 диска, а подходы самые разные. Поехали.

Диск 1. Сервер Supermicro

Первый диск будем менять в сервере Supermicro. Сервер Supermicro 4U: CSE-846BE16-R920B. Когда-то давно на нём собирали массивы:

Supermicro — используем слоты Rear 2.5 x 2 как зеркало под ОС

Диск HDD 6ТБ, форм-фактор 3.5'. Вот так выглядит сбойный диск, красный светодиод манит админа.

admin

Перед заменой диска необходимо убедиться, что проблема именно с диском. Сервер работает, выключить его нельзя. Соответственно, в утилиту Avago Config Utility для управления SAS-контроллером войти не удастся. На сервере работает операционная система Ubuntu. Для мониторинга состояния массива будем использовать утилиту storcli. Пример работы у меня уже есть, правда в Oracle Linux, но в данном случае это не принципиально:

Управление RAID контроллером LSI (Broadcom, Avago) с помощью StorCLI в Oracle Linux

Посмотрим, что у нас там с диском. Диск в состоянии "UBad-Unconfigured Bad". Всё понятно, нужно менять.

admin

Данный сервер поддерживает горячую замену дисков, мне же проще. Выдергиваем старый диск.

admin

Красный светодиод продолжает гореть на дисковой корзине. Перекручиваем салазки на новый диск.

admin

Устанавливаем диск в слот.

admin

После установки диска загорится синий диод, красный начнёт мигать.

admin

Начинается перестроение массива. Перестроение займёт много времени, больше суток.

drive

Потом, через пару дней проверил, массив в порядке:

admin

Замена диска прошла без проблем.

Диск 2. СХД HP MSA 2040

Второй диск меняю в СХД MSA 2040. Ранее уже менял подобные диски:

Замена диска в HP MSA 2040

Диск HDD 900ГБ, форм-фактор 2.5', поставляется с салазками для MSA. Для управления дисками используется утилита Storage Management Utility, вот так там выглядит дохлый диск:

admin

Он же на MSA с оранжевым светодиодом:

admin

Извлекаю старый диск.

admin

admin

Распаковываю новый диск.

admin

Устанавливаю новый диск.

admin

admin

Теперь нужно зайти в Storage Management Utility и добавить этот диск как Global Spare.

msa

Сразу скажу, что после этого новый диск вышел из строя. Жду ответа техподдержки, замена диска оказалась неуспешной.

Диск 3. Сервер HP ProLiant DL360 Gen9

Третий диск меняю в сервере HP ProLiant DL360 Gen9. Не первый раз меняю диски в этих серверах:

HPE Proliant DL360 Gen9 — замена дисков

Диск HDD 1ТБ, форм-фактор 2.5', поставляется с салазками. Битый диск светится оранжевым:

admin

Для мониторинга состояния дисков в серверах ProLiant девятого поколения используется утилита iLO 4. Скриншоты не делал. но там тоже видно какой диск вышел из строя.

Извлекаю битый диск.

admin

Устанавливаю новый диск.

admin

Всё просто, салазки перекручивать не нужно, операция быстрая. На всех дисках массива горит индикатор "не извлекать", начинается перестроение массива.

Диск 4. Сервер HPE ProLiant DL360 Gen9. NVMe.

Четвёртый диск не получится установить в работающий сервер. Диск представляет собой PCIe плату NVMe.

admin

Устанавливаем в сервер HPE ProLiant DL360 Gen9. Выключаем сервер, выдвигаем на салазках, снимаем крышку.

admin

В данный сервер можно установить одну полноразмерную PCIe плату и две низкопрофильные. Второй и третий слоты я уже занял, диск будет устанавливаться в первый полноразмерный слот. Снимаю райзер, понадобится отвертка torx.

admin

Кручу-верчу. В райзер устанавливается две PCIe платы. Одна уже установлена, устанавливаю вторую.

admin

Диск в райзере. Устанавливаю райзер в сервер.

admin

Закрываю крышку, включаю сервер. NVMe платы нельзя собрать в RAID через имеющийся RAID контроллер, у меня они собраны с помощью mdadm в операционной системе Ubuntu. Два диска были в RAID1, третий диск позволит увеличить объём массива в два раза, с преобразованием RAID1 в RAID5.

mdadm — конвертация RAID1 в RAID5

Потом

Все операции по работе с массивами дальше выполняю из дома. Какие-то перестроились за пару часов. Завтра нужно отправить заменённый по гарантии битый диск в HP, остальные диски без гарантии отправятся на утилизацию. Предварительно все данные на дисках будут уничтожены сильным электромагнитным импульсом, есть для этого специальное устройство.

Забегая вперёд можно сказать, что три из четырёх дисков встали нормально, массивы работают в штатном режиме. А вот четвёртый диск HP MSA 2040 подкачал, новый и не заработал. Техподдержка пока молчит.

Потом-потом

Прислали новый диск для HP MSA 2040, со второй попытки диск встал успешно, пришлось ехать в ЦОД ещё раз...

 

Похожие материалы

HP Proliant DL 120 Gen9 — установка платы Mellanox

Устанавливаем 10 GB плату Mellanox ConnectX-4 LX CX4121A в сервер HP Proliant DL 120 Gen9. На плате два порта SFP+, интерфейс PCIe3.0 x8. В комплекте к плате идёт низкопрофильная планка, она нам не понадобится, т.к. в сервереHP Proliant DL 120 Gen9 есть свободный полнопрофильный PCI слот.

Отключаем полку HPE MSA 2040 ES LFF Disk Enclosure от СХД и подключаем её к серверу

Привет, сегодня проводим эксперимент. Мы отключим полку HPE MSA 2040 ES LFF Disk Enclosure от СХД HP MSA 2040 и подключим её к серверу HPE Proliant DL360 Gen9.