Один из самых толстых NVMe дисков в нашей коллекции вышел из строя. Первый раз за три года.
Samsung SSD MZPLJ12THALA-00007 — NVMe 12.8 ТБ
Диск собран в RAID1 в паре с таким же, так что потери данных пока не произошло. Нужно брать запасной диск и ехать менять.
Эти диски и раньше барахлили, но не так часто как Intel, да и реанимировать их всегда получалось. Диск, к слову сказать, не вышел из строя полностью, он даже иногда определяется, но очень долго отвечает. Даже если его вернуть в массив, то через некоторое время его снова выкидывает. На боевой системе его использовать нет никакой возможности. Удаляю сбойный диск из программного массива через mdadm.
Замена такого диска возможна только с отключением сервера. Диск стоит в сервере Supermicro с материнской платой X10DRi. Выключаем сервер, выдвигаем из стойки.
Смотрим в зону PCIe. Помимо дисков установлены два RAID контроллера, они греются, поэтому я их не стал устанавливать рядом.
Сбойный диск слева, извлекаю его.
На новый диск устанавливаю полнопрофильную планку.
Новый диск точно такой же. Модель совпадает: MZPLJ12THALA-00007.
Устанавливаю новый диск.
Фиксирую плату диска винтом.
Физическая замена диска произведена. Включаю сервер и добавляю новый диск в массив.