Перейти к основному содержанию

Перегрев сервера HPE Proliant DL380 Gen10

HPE Proliant DL380 Gen10 LFF

Нет повести печальнее на свете, чем видеть в логе "System Overheating". Перегрелся сервер HPE Proliant DL380 Gen10, и выключился. Перегрелся из-за того, что в машинном зале вышел из строя кондиционер, внешняя температура повысилась.

В логах это выглядит очень просто. Сначала мы получаем сообщение вида:

System Overheating (Temperature Sensor 1, Location Ambient, Temperature 43)

hpe

Система мониторинга тоже не спит, на 42 °C приходит уведомление.

zabbix

Затем процессор начинает троттлиться и уходит в полку.

hpe

После этого получаем сообщение вида:

Automatic Operating System Shutdown Initiated Due to Overheat Condition

hpe

Сервер выключается.

Что можно сделать?

Нужно устранить причину перегрева, затем включить сервер.

Если причину перегрева устранить нельзя, а температура держится в пограничной зоне, когда сервер вот-вот отключится снова, можно подкрутить параметры сервера в iLO.

Power & Thermal → Fans → Fan Settings. Можно врубить вентиляторы на полную: Max Cooling.

hpe

Power & Thermal → Power Settings → Power Regulator Settings. Можно снизить производительность сервера: Static Low Power Mode.

hpe

В BIOS можно настроить профиль рабочей нагрузки.

HPE ProLiant Gen10 — меняем профиль рабочей нагрузки

В серверах HPE ProLiant Gen10, ProLiant Gen10 Plus и HPE Synergy существуют предустановленные профили рабочей нагрузки. В соответствии с выбранной рабочей нагрузкой сервер автоматически настроит все связанные с данным профилем параметры производительности в BIOS.

Если вы устанавливали профиль производительности на максимальную производительность, то можно сбросить на значение по умолчанию "General Power Efficient Compute".

hpe

После перезагрузки сервер станет меньше греться и эффективность системы охлаждения возрастёт.

Теги

 

Похожие материалы

Замена батарейки в HP Proliant DL360 Gen9

Не знаю почему, но батарейки в серверах HP Proliant DL360 Gen9 дохнут одна за одной, уже с десяток заменили. Возможно, партия такая была, не берусь судить. Новые батарейки пока работают без проблем. Вашему вниманию предлагается мини-инструкция по замене батарейки.

Теги

HPE ProLiant MicroServer Gen10 — мониторинг дисков

Что-то я обеспокоился состоянием дисков своего домашнего сервера HPE ProLiant MicroServer Gen10. У этого сервера есть одна маленькая, но очень большая проблема — мониторинг состояния дисков и дисковых массивов.