Перейти к основному содержанию
 

Реанимация NVMe диска в Linux — 2

Linux

Имеется сервер с операционной системой Oracle Linux. В сервере два NVME диска Samsung, которые объединены в зеркальный RAID1 массив.

Samsung SSD MZPLJ12THALA-00007 — NVMe 12.8 ТБ

Один из NVMe дисков на сервере перестал работать. Массив, собранный с помощью mdadm выкинул сбойный диск и продолжил в статусе degraded.

nvme

Посмотреть информацию об NVMe дисках можно с помощью утилиты nvme из пакета nvme-cli:

yum install nvme-cli
или
apt install nvme-cli

nvme list

Однако, утилита не смогла обнаружить второй NVMe диск и его контроллер.

Сервер в работе, перезагружать его нельзя. Можно посмотреть, определяется ли диск как PCI устройство командой lspci.

lspci | grep -E "NVMe|Non-Volatile"

Диски бывают разные, поэтому приходится думать, как именно обнаружить устройство в списке. Но у меня два одинаковых диска, один из них точно работает, поэтому мне проще. В итоге я вычисляю устройства. В списке присутствуют оба диска:

lspci | grep Samsung
02:00.0 Non-Volatile memory controller: Samsung Electronics Co Ltd Device a824
81:00.0 Non-Volatile memory controller: Samsung Electronics Co Ltd Device a824

Заходим в /sys/bus/pci/drivers/nvme/ и видим, что устройство 0000:02:00.0 имеется, а вот второго нет. Удаляем отсутствующий диск из списка устройств и заново сканируем PCI.

echo 1 > /sys/bus/pci/devices/0000\:81\:00.0/remove
echo 1 > /sys/bus/pci/rescan

На этом, собственно, всё. Диск определился.

nvme

Возвращаем диск в массив.

mdadm /dev/md30 --add /dev/nvme1n1p1

nvme

Массив начал восстанавливаться.

nvme

Ссылки

Реанимация NVMe диска в Linux

Теги

 

Похожие материалы

Supermicro — изменение разделов RAID Intel Rapid Storage

В моём сервере Supermicro под систему собран RAID1. Пришла задача - увеличить раздел boot на этом зеркале. Зеркало собрано встроенными средствами Intel Rapid Storage. Проблема возникла, когда я попытался загрузиться в Hiren's BootCD и разбить зеркало с помощью gparted. Упс, отдельные диски зеркала увиделись, а само зеркало - нет.

Проблема с SNMP на серверах HP Proliant Gen9

Столкнулся с неизлечимой проблемой на серверах HP Proliant. Через случайный промежуток времени (от нескольких минут до нескольких дней) служба SNMP в ILO сервера зависает. Это происходит на серверах, которые активно мониторятся через SNMP. 

Теги

Уменьшение виртуального диска с LVM

У нас есть виртуальная машина, на ней есть диск. Диск большой, данных мало. Наша задача - сделать диск меньшего размера. На борту Logical Volume Manager (LVM). Gparted не умеет переносить данные на LVM разделах. Будем делать всё руками.