Перейти к основному содержанию

HPE Proliant — сбой электропитания

error

Если вы используете сервер HPE Proliant с RAID контроллером без батарейки, то при потере электропитания можете получить неприятную ошибку.

1779-Slot 1 Drive Array - Replacement drive(s) detected OR previously failed drive(s) now appear to be operational: <список дисков> Logical Drive(s) disabled due to possible data loss. Action: Resolve any issues that disabled drive. Restore data from backup if drive(s) replaced.

Дальше могут быть варианты. Могут быть предложения продолжить без дисков или согласиться с потерей данных и восстановить массив.

Select F1 to continue with logical drive(s) disabled
Select F2 to accept data loss and to re-enable logical drive(s)

Или может быть вариант, где можно перейти к меню с просмотром проблем при работе системы.

Обычно сервер продолжает грузиться и, если на массиве была система, загрузиться не может.

Собственно, причина ошибки простая. RAID контроллер зафиксировал подключение дисков после сбоя электропитания. В этом случае данные в массиве могут быть не согласованы, что-то могло не записаться.

Если согласиться с "data loss and to re-enable logical drive(s)", то массив или соберётся или нет. Как правило, после обычного отключения питания массив собирается.

Если зайти в SSA и посмотреть состояние массивов, то увидим страшную ошибку:

...All data on this drive has been lost...

Могли бы написать что-нибудь менее страшное.

hpe

В опциях логического диска есть вариант Re-enable Failed Logical Drive. Но я не люблю ей пользоваться.

hpe

Или выбираю при загрузке вариант:

Select F2 to accept data loss and to re-enable logical drive(s)

Или проваливаюсь в список проблем System Health.

hpe

Видим проблему с контроллером: 

[ Configuration Required ] Slot 3 Port 1 : Smart Array P840 Controller

Проваливаемся внутрь.

hpe

Видим подробную ошибку. Проваливаемся в пункт:

Health Status: Configuration Required
hpe

Из предложенный вариантов выбираем Repair. Если повезёт, то массив восстановится и всё будет работать нормально. Даже если всё восстановится, это звоночек.

Что можно предложить ещё?

Как минимум можно задуматься:

  • Не купить ли батарейку для контроллера?
  • Не использовать ли разные электрические вводы?
  • Не поставить ли ИБП?
  • Не проверить ли как работает система резервного копирования, если она есть?
  • Не забэкапить ли данные сервера, если бэкапов нет?
  • Не поставить ли второй резервный сервер на другую площадку?
  • Не рассмотреть ли резерв в облаке?

Теги

Цены

 

Похожие материалы

HPE ProLiant DL360 Gen9 — RAID 5 из неоригинальных SSD 15ТБ

При покупке неоригинальных дисков для серверов HPE всегда есть риск того, что диски не заработают, или RAID контроллер их не увидит, или заработают, но не так как планировалось, или кулеры включатся на 100%, или случится ещё какая-нибудь неизведанная ерунда.

Внутренний мир картриджа HP Ultrium LTO6 6,25TB

Для всех кто всегда задавался вопросом: "А что же внутри?" Для тех, кто не боялся посмотреть за грань. Технарям не по знаниям а по духу! Представляем внутренний мир картриджа HP Ultrium LTO6 6,25TB :)

Теги