Перейти к основному содержанию

HPE Proliant — CPU Throttling Triggered

Hewlett Packard Enterprise

Погода была прекрасная. Настроение было замечательное. Всё работало как часы. Ничего не предвещало беды. И, вдруг, сервер HPE ProLiant DL360 Gen10 сошёл с ума.

Пришло сообщение:

EVENT (26-Jan-2022 00:55): CPU Throttling Triggered, CPU may be operating at reduced performance.
ACTION: Check the thermals of the system. Check fans, processor heat sink and air baffles installation.

Троттлинг — это специальный механизм защиты процессора от перегрева. Чем больше температура, тем больше тактов пропускает процессор. Температура процессора при этом снижается, производительность тоже.

Без такой защиты процессор может сгореть, если система охлаждение выйдет из строя. Лучше снижение производительности, чем дохлый сервер.

cpu

Я бросился проверять температуру сервера. К моему удивлению температура оказалась в порядке, питание тоже. Нагрузка на CPU по мониторингу не превышала 30%, всплесков не было. Странно.

cpu

Через сутки ситуация повторилась, а потом снова.

cpu

Пришлось обратиться поддержку. Там посоветовали сделать две вещи:

  • Изменить план рабочей нагрузки на более производительный.
  • Повысить обороты вентиляторов.

План рабочей нагрузки

HPE ProLiant Gen10 — меняем профиль рабочей нагрузки

Перезагружаю сервер.

esxi

Текущий профиль: Workload Profile: General Power Efficient Compute. У меня сервер выполняет роль гипервизора, для этот профиль не самый лучший. Установлю Virtualization - Max Performance. Нажимаю F9.

esxi

System Configuration.

esxi

BIOS/Platform Configuration (RBSU).

hpe

Изменяем Workload Profile на Virtualization - Max Performance.

esxi

OK.

esxi

F12: Save and Exit.

esxi

Yes - Save Changes.

esxi

Reboot. Сервер перезагружается.

План рабочей нагрузки Virtualization - Max Performance меняет некоторые параметры BIOS:

  • System Configuration → BIOS/Platform Configuration (RBSU) → Power and Performance Options → Power Regulator. Static High Performance Mode—Processors.
  • System Configuration → BIOS/Platform Configuration (RBSU) → Power and Performance Options → Minimum Processor Idle Power Core C-State. No C-states.
  • System Configuration → BIOS/Platform Configuration (RBSU) → Power and Performance Options → Minimum Processor Idle Power Package C-State. No Package State.
  • System Configuration → BIOS/Platform Configuration (RBSU) → Power and Performance Options → Energy/Performance Bias. Maximum Performance.
  • System Configuration → BIOS/Platform Configuration (RBSU) → Power and Performance Options → Collaborative Power Control. Disabled.

Обороты вентиляторов

Вентиляторы настраиваются в iLO в разделе Power & Thermal → Fans.

cpu

Значение по умолчанию: Optimal Cooling (16%). Для внесения изменений нужно загрузить сервер и нажать на карандаш.

cpu

Возможные варианты:

  • Optimal Cooling
  • Enhanced CPU Cooling
  • Increased Cooling
  • Maximum Cooling

Я устанавливаю Maximum Cooling.

cpu

Потребуется перезапуск iLO.

cpu

Теперь вентиляторы загружены на 100%.

Заключение

Проблема с троттлингом процессора решена. Больше ошибок не было.

Через несколько дней я вернул настройки вентиляторов на прежние: Optimal Cooling. Вероятно, проблема решилась только сменой плана рабочей нагрузки. Однако, если температура в стойке высокая, то можно и повысить обороты.

Следите за охлаждением! Здоровья вашим серверам.

Ссылки

HPE Proliant — CPU Throttling Triggered 2

Теги

Цены

 

Похожие материалы

Zabbix — добавление элемента данных и триггера для HP MSA 2050

Появилась необходимость мониторить HP MSA 2050.  Я уже выкладывал Zabbix шаблон для мониторинга СХД - HP MSA 2040. Шаблон от HP MSA 2040 вполне подходит для мониторинга HP MSA 2050, но есть тонкость: в новом СХД добавились новые трапы. В этой статье я приведу пример, как добавить в шаблон новый неизвестный трап. Итак, от HP MSA 2050 пришёл неизвестный трап:

Тестируем 10G SFP+ платы HP и Mellanox на серверах HP Proliant DL360 Gen9

Задача - проверить пропускную способность 10G сети между виртуальными машинами на разных гипервизорах.

VMware vSphere Hypervisor (ESXi) 6.7U1 — HPE Customized image

Не секрет, что для установки ESXi на сервера многие производители предлагают кастомизированные инсталляционные образы. Зачем использовать такие образы? Да из-за драйверов, в основном. Кастомизированные образы уже содержат набор драйверов для RAID контроллеров и сетевых карт.