Все диски рано или поздно выходят из строя. Для TrueNAS имеется инструкция по замене диска:
https://www.truenas.com/docs/core/13.0/coretutorials/storage/disks/diskreplace/
Если кратко, то нужно:
- Перевести сбойный диск в OFFLINE
- Заменить физически сбойный диск на новый
- Заменить сбойный диск на SPARE
- Отцепить сбойный диск: DETACH
- Добавить новый диск как SPARE
Это для нормальных отказоустойчивых массивов. Понятно, что RAID0 придётся пересоздавать заново.
Давайте рассмотрим более интересную ситуацию, когда дохлый диск в сервере оперативно заменили на новый, а в TrueNAS при этом ничего не делали.
Вот классическая картина того, что происходит, если сначала заменить диск. У нас вышел из строя диск da14, сейчас он в статусе FAULTED. SPARE диск da12 стал с ним рядом в очередь в статусе ONLINE, он же в секции SPARE помечен как UNAVAIL.
Сбойному диску делаем Detach.
Подтверждаем операцию.
Ловим ошибку, что не удаётся вайпнуть диск. Это нормально когда диск сломан, особенно когда его нет. Обновляем экран, da14 из массива пропал и SPARE диск подцепился вместо него.
А вот da14 так и остался в системе со старым серийным номером. Он не входит ни в какой пул. Для того, чтобы TrueNAS понял, что диск уже заменили, достаточно выполнить перезагрузку.
После перезагрузки серийный номер сменился. Теперь добавляем da14 в качестве SPARE в массив.
Проблема устранена.