Перейти к основному содержанию

Перегрев сервера HPE Proliant DL380 Gen10

HPE Proliant DL380 Gen10 LFF

Нет повести печальнее на свете, чем видеть в логе "System Overheating". Перегрелся сервер HPE Proliant DL380 Gen10, и выключился. Перегрелся из-за того, что в машинном зале вышел из строя кондиционер, внешняя температура повысилась.

В логах это выглядит очень просто. Сначала мы получаем сообщение вида:

System Overheating (Temperature Sensor 1, Location Ambient, Temperature 43)

hpe

Система мониторинга тоже не спит, на 42 °C приходит уведомление.

zabbix

Затем процессор начинает троттлиться и уходит в полку.

hpe

После этого получаем сообщение вида:

Automatic Operating System Shutdown Initiated Due to Overheat Condition

hpe

Сервер выключается.

Что можно сделать?

Нужно устранить причину перегрева, затем включить сервер.

Если причину перегрева устранить нельзя, а температура держится в пограничной зоне, когда сервер вот-вот отключится снова, можно подкрутить параметры сервера в iLO.

Power & Thermal → Fans → Fan Settings. Можно врубить вентиляторы на полную: Max Cooling.

hpe

Power & Thermal → Power Settings → Power Regulator Settings. Можно снизить производительность сервера: Static Low Power Mode.

hpe

В BIOS можно настроить профиль рабочей нагрузки.

HPE ProLiant Gen10 — меняем профиль рабочей нагрузки

В серверах HPE ProLiant Gen10, ProLiant Gen10 Plus и HPE Synergy существуют предустановленные профили рабочей нагрузки. В соответствии с выбранной рабочей нагрузкой сервер автоматически настроит все связанные с данным профилем параметры производительности в BIOS.

Если вы устанавливали профиль производительности на максимальную производительность, то можно сбросить на значение по умолчанию "General Power Efficient Compute".

hpe

После перезагрузки сервер станет меньше греться и эффективность системы охлаждения возрастёт.

Теги

 

Похожие материалы

Zabbix шаблон для мониторинга сервера HPE Proliant DL580 Gen10

Делюсь полезным шаблоном для мониторинга сервера  HPE Proliant DL580 Gen10. Мониторим по IPMI. Шаблон делал сам. В шаблоне 8 приложений, 175 элементов данных, 50 триггеров и 4 графика.

Теги