Не так давно разбирался с тем, как заменить размер логического сектора у диска с 520 байт на 512 байт. Тогда всё прошло успешно и по результатам была написана статья:
Меняем размер логического сектора диска: 520, 524, 528, 512, 4k
Даже ролик был смонтирован для инструкции.
Один из наших коллег решил повторить эксперимент. Он менял размер логического сектора у диска 1643а 7.6 ТБ с 4k байт на 512 байт. Первый диск отформатировался без проблем (это важно), а остальные диски то же модели форматироваться не захотели с ошибкой:
Fixed format, current; Sense key: Unit Attention Additional sense: Power on occurred Unit attention condition queue: overflow flag is 0 FORMAT UNIT Complete
Если точнее, то форматирование начиналось, но прерывалось через какое-то время.
Форматирование с параметром --six выдало ту же ошибку:
sg_format --format --size=512 --six /dev/sg1
Начали думать, собрали статистику и заметили следующее:
- Каждый раз одна и та же ошибка, но на разных этапах форматирования. Иногда до 50% успевало доходить.
- Один диск, самый первый, отформатировался успешно.
Можно сделать вывод, что проблема не в модели диска. Один-то диск успешно отформатировался. Проблема не в контроллере, по той же самой причине. Проблема не в качестве дисков, потому как ошибка на одном и том же диске проявлялась бы на одном сбойном месте, а она происходит случайным образом. Есть подозрение на какой-то аппаратный сбой.
Код ошибки был найден в таблице SMART ASC/ASCQ error codes and messages:
(ASC 29, ASCQ 01) POWER ON OCCURRED
Есть только одно предположение. Диск теряет питание, потом контакт восстанавливается, питание возобновляется, происходит ошибка.
Коллега разбирает всю систему, продувает/прочищает контакты и переподключает провода. Пробует форматировать, и...
Диск успешно форматируется.
Форматируй с нами.
Форматируй как мы.
Форматируй лучше нас!