Перейти к основному содержанию

Замена диска Samsung NVMe 12.8 ТБ

NVMe

Один из самых толстых NVMe дисков в нашей коллекции вышел из строя. Первый раз за три года.

Samsung SSD MZPLJ12THALA-00007 — NVMe 12.8 ТБ

Диск собран в RAID1 в паре с таким же, так что потери данных пока не произошло. Нужно брать запасной диск и ехать менять.

Эти диски и раньше барахлили, но не так часто как Intel, да и реанимировать их всегда получалось. Диск, к слову сказать, не вышел из строя полностью, он даже иногда определяется, но очень долго отвечает. Даже если его вернуть в массив, то через некоторое время его снова выкидывает. На боевой системе его использовать нет никакой возможности. Удаляю сбойный диск из программного массива через mdadm.

Замена такого диска возможна только с отключением сервера. Диск стоит в сервере Supermicro с материнской платой X10DRi. Выключаем сервер, выдвигаем из стойки.

nvme

Смотрим в зону PCIe. Помимо дисков установлены два RAID контроллера, они греются, поэтому я их не стал устанавливать рядом.

nvme

Сбойный диск слева, извлекаю его.

nvme

На новый диск устанавливаю полнопрофильную планку.

nvme

Новый диск точно такой же. Модель совпадает: MZPLJ12THALA-00007.

nvme

Устанавливаю новый диск.

nvme

Фиксирую плату диска винтом.

nvme

Физическая замена диска произведена. Включаю сервер и добавляю новый диск в массив.

Ссылки

mdadm — полезные команды

Цены

 

Похожие материалы

Supermicro — установка SSD дисков Samsung MZ7L33T8HBNA-00A07

Приветствую. Сегодня поработаем руками. У нас задача — установить в сервер Supermicro SSD диски и проверить, что они корректно определились.

Вышли из строя диски сразу в двух серверах

Одновременно вышли из строя NVMe диски сразу в двух серверах баз данных, на основном и резервном контуре. Ситуация не самая обычная, но ещё не критичная. RAID массивы на серверах выдерживают выход из строя только одного диска, сейчас как раз по одному диску на массивах и выпало.

HPE ProLiant DL360 Gen9 — RAID 5 из неоригинальных SSD 15ТБ

При покупке неоригинальных дисков для серверов HPE всегда есть риск того, что диски не заработают, или RAID контроллер их не увидит, или заработают, но не так как планировалось, или кулеры включатся на 100%, или случится ещё какая-нибудь неизведанная ерунда.