Посмотрим наличие плохих блоков на массивах сервера Dell с помощью утилиты perccli.
perccli — утилита для управления RAID контроллерами Dell серверов. То же самое что и storcli, синтаксис ничем не отличается.
Команда, отображающая наличие bad-блоков на виртуальных дисках:
perccli /cx/vx show bbmt
Можно посмотреть сразу на всех томах:
/opt/MegaRAID/perccli/perccli64 /call/vall show bbmt
Отобразится таблица с исправленными и неисправленными bad-блоками. bbmt — Bad Block Mapping Table.
Все bad-блоки можно разделить на две большие группы: логические и физические.
Физические bad-блоки могут быть связаны с дефектом поверхности из-за износа магнитного покрытия или физического повреждения: удара, неисправности механической или электронной части диска, царапинам от мельчайших частиц пыли. Встречаются неудачные модели дисков, в которых из поверхности диска могут выбиться мелкие частицы, которые выбивают ещё частицы и процесс деградации диска растёт лавинообразно.
Такие сектора не могут быть восстановлены и должны быть исключены из работы. Восстановление их не представляется возможным. Считывание информации из них иногда возможно. Такие блоки помечаются в таблице как Un-Corrected и вместо них используются блоки из резервной области данных.
Появление логических bad-блоков чаще всего обусловлено ошибками записи. В большинстве случаев такие bad-блоки могут быть исправлены и помечаются в таблице как Corrected. Некоторые логические bad-блоки тоже могут быть неисправимыми из-за повреждения адаптивов или полей идентификаторов в старых жёстких дисках. Такие bad-блоки могут исправить только на заводе-изготовителе или в сервисном центре.
У SSD принцип тот же. Удалось восстановить сектор — Corrected, не удалось — Un-Corrected.
Может пригодиться команда очистки LDBBM таблицы (Logical Disk Bad Block Mapping Table):
- perccli /cx/vx delete bbmt