На сервере Supermicro сгорел RAID контроллер Avago MegaRAID SAS 9380-8i8e. Он отображался в системе как AVAGOMegaRAIDSAS9361-16i, потому что был каким-то прототипом, но на самом деле у него было 8 внутренних и 8 внешний портов. В данном сервере у меня два одинаковых контроллера. Один обслуживает 24 диска в самом сервере, ко второму подключена внешняя полка ещё с 24 дисками.
Пока ехал новый заказанный контроллер, я успел съездить в ЦОД и подключить полку с дисками к рабочему контроллеру, благо есть внешние порты. Да, производительность резко просела с одним контроллером, но хотя бы что-то работает.
Раньше контроллер уже глючил:
Supermicro — сбой RAID контроллера AVAGOMegaRAIDSAS9361-16i
Видимо, пришла пора его менять.
Подготовка RAID контроллера
И вот новый контроллер приехал:
Первым делом накатываю на контроллер прошивку, чтобы версии на обоих контроллерах совпадали.
Прошивка Avago MegaRAID SAS 9380-8i8e из Windows
На этом подготовка завершена, пора ехать в ЦОД и устанавливать контроллер в сервер.
Замена RAID контроллера
Выключаю сервер.
Выкручиваю винты, выдвигаю сервер и снимаю крышку.
Извлекаю сгоревший контроллер. На самом деле я его уже вытащил и слот свободен. На фотографии ниже видно, что сейчас установлен только один RAID контроллер, к нему тянется кабель от батарейки.
Распаковываю новый контроллер. Планку менять не пришлось.
Уже на практики знаю, что батарейку удобнее подключить до установки контроллера в слот. Подключаю батарейку к новому контроллеру.
Устанавливаю контроллер в слот. Два одинаковых контроллера радуют глаз.
По инструкции батарейки положено крепить к специальным планкам, которые устанавливаются в PCIe слот.
Кто это придумал? У меня нет столько свободных слотов. Поэтому я устанавливаю батарейки между вентиляторами. Нормально стоят.
Настройка RAID контроллера
Настраивать контроллер особо не нужно, понадобится пара перезагрузок.
Собираю сервер и переключаю полку с дисками на новый контроллер. Включаю сервер.
С первого раза контроллер не увидел диски. Это нормально.
Дожидаюсь полной загрузки сервера и перезагружаю его. Ctrl + R поможет попасть в конфигурационную утилиту.
Вижу два контроллера, проверяю новый. Статус Optimal, статус батарейки Optimal.
Утилита storcli поможет посмотреть статус контроллера из операционной системы Linux.
./storcli show
Полный порядок, диски увиделись, массивы увиделись, сервер полностью работоспособен.
Полезные ссылки
CacheVault CVPM02 для контроллера MegaRAID SAS 9380-8i8e
Проверка статуса контроллеров Avago MegaRAID и батарей в Linux
Управление RAID контроллером LSI (Broadcom, Avago) с помощью StorCLI в Oracle Linux