Диски SSD NVMe PCIe очень производительные. С постоянно растущими нагрузками для обеспечения требуемой производительности приходится использовать такие диски. Однако, большой надёжностью эти диски похвастаться не могут.
Сама по себе технология SSD подразумевает ограниченный цикл перезаписи ячеек памяти. Чем чаще мы пишем данные, тем быстрее выйдет из строя диск. Первые модели SSD у меня постоянно выходили из строя. Со временем надёжность твердотельных накопителей повысилась. Часть ячеек памяти зарезервирована как запасная, поэтому даже с битыми ячейками диск продолжает работать, использую свой запас. Технология Over-Provisioning в SSD еще больше повышает надёжность диска, но уменьшает его объём.
Иногда производители допускают ошибки в прошивках, диски начинают выходить из строя при определённых условиях, задолго до срока износа ячеек памяти. Производители выпускают новые прошивки с исправлениями, работы админам добавляется. Приходится и отслеживать критические исправления для всего модельного ряда устройств, тратить время на установку обновлений. Да и сам процесс прошивки не всегда тривиален.
Надёжность SSD растёт, но диски всё равно рано или поздно выходят из строя. У меня платы SSD NVMe PCIe постоянно глючат, но до сих пор все диски удавалось реанимировать, до этого дня.
ААА, вышел из строя диск
Вышел из строя диск Intel PCIe SSD NVMe серии Intel SSD DC P4500 Series объёмом 4 ТБ.
Intel PCIe SSD NVMe диск — SSDPEDKX040T7
Программный массив RAID1 спас данные, мы быстро перенесли их на другое хранилище. Операционная система диск не видит. Перезагрузка не помогла. Известные способы реанимации диска тоже не помогли.
Диск из сервера я выдернул и подключил к своему компьютеру. Светодиоды горят, питание на диске есть.
У меня операционная система Windows 10, устанавливаю драйвера:
Драйвер Intel PCIe NVMe SSD для Windows
Контроллер диска определился.
А самого диска нет.
Для работы с диском устанавливаю утилиту SST:
Solidigm Storage Tool — управление дисками Intel и Solidigm
Данные с контроллера считываются.
Самое интересное: Drive Health — Healthy. Однозначно врут.
Диагностическое сканирование:
Ничего не дало.
Попытался прошить, безуспешно.
Невозможно запустить эту функцию на SSD-накопителях с пониженной производительностью. За помощью обратитесь к реселлеру или в службу поддержки.
Intel нас покинул, обращаться некуда.
Воспользуемся CLI. Определяем диски.
sst show -ssd
Отобразился список дисков, включая наш Intel.
Диск второй (Index : 2), отобразим только его:
sst show -ssd 2
Статус устройства:
DeviceStatus : BAD_CONTEXT_2020
Ещё мне не нравится PercentOverProvisioned, аж 100%. Выведем дополнительные данные:
sst show -a -ssd 2
Находим строчку:
EnduqranceAnalyzer : Selected drive is in a disable logical state.
И ещё строчку:
NativeMaxLBA : Selected drive is in a disable logical state.
И ещё:
TCGSecurityState : Selected drive is in a disable logical state.
Техподдержка Intel нашим зарубежным коллегам сообщает, что диски с такой ошибкой подлежат замене. В очень редких случаях может помочь установка прошивки. Пробую прошить:
sst load -ssd 2
Status : Selected drive is in a disable logical state.
И всё. Способов решения данной проблемы я не нашёл. В моём случае прошивка не ставится. Кто узнает как чинить — пишите. А пока диск полежит на полочке...