Перейти к основному содержанию

Перегрев сервера HPE Proliant DL380 Gen10

HPE Proliant DL380 Gen10 LFF

Нет повести печальнее на свете, чем видеть в логе "System Overheating". Перегрелся сервер HPE Proliant DL380 Gen10, и выключился. Перегрелся из-за того, что в машинном зале вышел из строя кондиционер, внешняя температура повысилась.

В логах это выглядит очень просто. Сначала мы получаем сообщение вида:

System Overheating (Temperature Sensor 1, Location Ambient, Temperature 43)

hpe

Система мониторинга тоже не спит, на 42 °C приходит уведомление.

zabbix

Затем процессор начинает троттлиться и уходит в полку.

hpe

После этого получаем сообщение вида:

Automatic Operating System Shutdown Initiated Due to Overheat Condition

hpe

Сервер выключается.

Что можно сделать?

Нужно устранить причину перегрева, затем включить сервер.

Если причину перегрева устранить нельзя, а температура держится в пограничной зоне, когда сервер вот-вот отключится снова, можно подкрутить параметры сервера в iLO.

Power & Thermal → Fans → Fan Settings. Можно врубить вентиляторы на полную: Max Cooling.

hpe

Power & Thermal → Power Settings → Power Regulator Settings. Можно снизить производительность сервера: Static Low Power Mode.

hpe

В BIOS можно настроить профиль рабочей нагрузки.

HPE ProLiant Gen10 — меняем профиль рабочей нагрузки

В серверах HPE ProLiant Gen10, ProLiant Gen10 Plus и HPE Synergy существуют предустановленные профили рабочей нагрузки. В соответствии с выбранной рабочей нагрузкой сервер автоматически настроит все связанные с данным профилем параметры производительности в BIOS.

Если вы устанавливали профиль производительности на максимальную производительность, то можно сбросить на значение по умолчанию "General Power Efficient Compute".

hpe

После перезагрузки сервер станет меньше греться и эффективность системы охлаждения возрастёт.

Теги

 

Похожие материалы

Zabbix шаблон для мониторинга сервера HP Proliant ML30 Gen9

Делюсь полезным шаблоном для мониторинга сервера  HP Proliant ML30 Gen9. Мониторим по IPMI. Шаблон делал сам. В шаблоне 5 приложений, 35 элементов данных, 7 триггеров и 1 график.

Теги

День, когда я менял диски

Сегодня не самый обычный пост, я еду в ЦОД менять и устанавливать диски. Любопытно, что все диски разные, оборудование тоже разное. Для мониторинга состояния дисков потребуется самые разные инструменты. Вроде бы всего 4 диска, а подходы самые разные. Поехали.