Признаюсь честно, я не знал о технологии Copyback Hot Spare до этого дня. История о том, как простая замена диска меня напугала.
Однажды на сервере ночью сдох диск. Сервер Dell PowerEdge R740xd2 со встроенным RAID контроллером PERC H730P Mini (Embedded). Диски на сервере объединены в RAID6. Ну сдох и сдох, бывает. На этот случай имеется HOT SPARE диск, который моментально был подхвачен контроллером вместо дохлого. К утру целостность RAID массива была восстановлена, никаких действий от системных администраторов не потребовалось.
Сервер был на гарантии, сгоревший диск был заменён через пару дней на новый. После замены диска я по привычке полез в iDRAC, чтобы подключить новый диск в качестве HOT SPARE, а диск не доступен. Что за дела? Я обеспокоился. Ладно, обновляю прошивку iDRAC, а диск всё равно недоступен. В списке отображается, а сделать из него HOT SPARE нельзя. Так дело не пойдёт, мне нужно обезопасить массив на случай повторных сбоев и массиву требуется запасной диск.
Перезагружаю сервер.
Лезу в настройки RAID контроллера и вывожу список физических дисков.
Физический диск находится в статусе "Replacing". И процесс Replace выполнен на 5%.
Первый раз вижу такой статус диска: "Replacing". Если посмотреть статус диска с помощью утилиты perccli64, то статус называется по-другому: "Copyback".
Slot Number: 0 - Online, Spun Up Slot Number: 1 - Copyback Slot Number: 2 - Online, Spun Up Slot Number: 3 - Online, Spun Up Slot Number: 4 - Online, Spun Up Slot Number: 5 - Online, Spun Up Slot Number: 6 - Online, Spun Up Slot Number: 7 - Online, Spun Up Slot Number: 8 - Online, Spun Up Slot Number: 9 - Online, Spun Up Slot Number: 10 - Online, Spun Up Slot Number: 11 - Online, Spun Up Slot Number: 24 - Online, Spun Up Slot Number: 25 - Online, Spun Up
И по запросу "hot spare" и "copyback" Интернет рассказывает мне о технологии Copyback Hot Spare.
Copyback Hot Spare — это функция RAID контроллера, которая позволяет закрепить физическое расположение диска "горячего резерва" (Hot Spare), что позволяет улучшить управляемость системы.
Т.е. произошло следующее:
- Сдох диск в слоте №1.
- RAID контроллер исключил дохлый диск из массива.
- RAID контроллер использовал вместо неисправного диска HOT SPARE из слота №11.
- Дохлый диск в слоте №1 был заменён на исправный.
- RAID контроллер увидел новый диск в слоте №1, установил ему статус Replacing (Copyback) и начал перекачивать на него данные с диска в слоте №11.
- После окончания процедуры RAID контроллер должен ввести в массив диск в слоте №1, а диск в слоте №11 выкинуть из массива и сделать HOT SPARE.
Посмотрел в настройки контроллера PERC H730P Mini (Embedded) через iDRAC. Действительно, есть опция Copyback Mode, и она установлена в On.
Через пару дней структура массива стала такой же, какая была до сбоя диска.
Преимущества и недостатки Copyback Hot Spare
Недостаток в том, что данная функция осуществляет дополнительную нагрузку на массив, что сказывается на производительности системы в момент перестроения данных.
Преимущества очевидны, мы всегда знаем где у нас стоят SPARE диски. Не всегда удобно, когда массив размазан по нескольким полкам. Это затрудняет замену или отключение неиспользуемой полки с дисками без перестроения массива. Для меня, как системного администратора, это очень удобно.
Copyback Hot Spare позволяет сделать ещё один финт, который экономит диски. Если у нас RAID контроллер обслуживает несколько массивов из дисков разного объёма, то можно в качестве HOT SPARE назначить диск большого объёма, который может использоваться как запасной для любого из массивов. Получается один SPARE диск на все массивы. После устранения аварии мы снова имеем HOT SPARE диск, который подходит всем массивам RAID контроллера.