Перейти к основному содержанию

HPE Proliant — CPU Throttling Triggered

Hewlett Packard Enterprise

Погода была прекрасная. Настроение было замечательное. Всё работало как часы. Ничего не предвещало беды. И, вдруг, сервер HPE ProLiant DL360 Gen10 сошёл с ума.

Пришло сообщение:

EVENT (26-Jan-2022 00:55): CPU Throttling Triggered, CPU may be operating at reduced performance.
ACTION: Check the thermals of the system. Check fans, processor heat sink and air baffles installation.

Троттлинг — это специальный механизм защиты процессора от перегрева. Чем больше температура, тем больше тактов пропускает процессор. Температура процессора при этом снижается, производительность тоже.

Без такой защиты процессор может сгореть, если система охлаждение выйдет из строя. Лучше снижение производительности, чем дохлый сервер.

cpu

Я бросился проверять температуру сервера. К моему удивлению температура оказалась в порядке, питание тоже. Нагрузка на CPU по мониторингу не превышала 30%, всплесков не было. Странно.

cpu

Через сутки ситуация повторилась, а потом снова.

cpu

Пришлось обратиться поддержку. Там посоветовали сделать две вещи:

  • Изменить план рабочей нагрузки на более производительный.
  • Повысить обороты вентиляторов.

План рабочей нагрузки

HPE ProLiant Gen10 — меняем профиль рабочей нагрузки

Перезагружаю сервер.

esxi

Текущий профиль: Workload Profile: General Power Efficient Compute. У меня сервер выполняет роль гипервизора, для этот профиль не самый лучший. Установлю Virtualization - Max Performance. Нажимаю F9.

esxi

System Configuration.

esxi

BIOS/Platform Configuration (RBSU).

hpe

Изменяем Workload Profile на Virtualization - Max Performance.

esxi

OK.

esxi

F12: Save and Exit.

esxi

Yes - Save Changes.

esxi

Reboot. Сервер перезагружается.

План рабочей нагрузки Virtualization - Max Performance меняет некоторые параметры BIOS:

  • System Configuration → BIOS/Platform Configuration (RBSU) → Power and Performance Options → Power Regulator. Static High Performance Mode—Processors.
  • System Configuration → BIOS/Platform Configuration (RBSU) → Power and Performance Options → Minimum Processor Idle Power Core C-State. No C-states.
  • System Configuration → BIOS/Platform Configuration (RBSU) → Power and Performance Options → Minimum Processor Idle Power Package C-State. No Package State.
  • System Configuration → BIOS/Platform Configuration (RBSU) → Power and Performance Options → Energy/Performance Bias. Maximum Performance.
  • System Configuration → BIOS/Platform Configuration (RBSU) → Power and Performance Options → Collaborative Power Control. Disabled.

Обороты вентиляторов

Вентиляторы настраиваются в iLO в разделе Power & Thermal → Fans.

cpu

Значение по умолчанию: Optimal Cooling (16%). Для внесения изменений нужно загрузить сервер и нажать на карандаш.

cpu

Возможные варианты:

  • Optimal Cooling
  • Enhanced CPU Cooling
  • Increased Cooling
  • Maximum Cooling

Я устанавливаю Maximum Cooling.

cpu

Потребуется перезапуск iLO.

cpu

Теперь вентиляторы загружены на 100%.

Заключение

Проблема с троттлингом процессора решена. Больше ошибок не было.

Через несколько дней я вернул настройки вентиляторов на прежние: Optimal Cooling. Вероятно, проблема решилась только сменой плана рабочей нагрузки. Однако, если температура в стойке высокая, то можно и повысить обороты.

Следите за охлаждением! Здоровья вашим серверам.

Ссылки

HPE Proliant — CPU Throttling Triggered 2

Теги

Цены

 

Похожие материалы

HPE SUM — Smart Update Manager

Утилита Smart Update Manager позволяет обновлять прошивки HPE ProLiant серверов и HPE Integrity серверов. SUM управляется через браузер, а также через командную строку. Есть версия для Linux. Утилита может ставить прошивки на локальный сервер, т.е. там, где она установлена. Кроме этого утилита позволяет устанавливать ПО и на другие сервера. Для системного администрирования очень полезная штука. Поставил на один сервер, и с него раскидываешь прошивки на остальные сервера.

Теги