Перейти к основному содержанию

Проблема с SNMP на серверах HPE Proliant Gen9

Hewlett Packard Enterprise

Столкнулся с неизлечимой проблемой на серверах HPE Proliant. Через случайный промежуток времени (от нескольких минут до нескольких дней) служба SNMP в ILO сервера зависает. Это происходит на серверах, которые активно мониторятся через SNMP. 

Проблема проявляется на серверах:

  • HPE Proliant DL 20 Gen 9
  • HPE Proliant DL 120 Gen 9
  • HPE Proliant DL 360 Gen 9
  • HPE Proliant DL 380 Gen 9
  • HPE Proliant DL 580 Gen 9

После перезапуска ILO - SNMP начинает работать, но через случайный промежуток времени снова зависает. 

Ошибок нигде не светится. Обновление ILO до последней прошивки не исправляет проблему.

Поддержка HP решить проблему не смогла, её смешные непрофессиональные ответы писать даже стыдно. Поддержка дотянула до 31 декабря 2017 года и попросила закрыть тикет и в новом году снова открыть. Видимо, для получения премии им не хватало одного закрытого тикета. Печалька.

Если на сервере используется hp-ams (Agentless Management Service for HP ProLiant servers with iLO4), то проблему можно решить созданием задачи в кроне, которая будет перезапускать зависший демон при его падении. Этот костыль применим, если на сервере стоит ubuntu или нечто подобное. Для ESXi, возможно, тоже можно придумать свой костыль, но слишком неудобно при большом количестве серверов.

service amsHelper status

ams-helper

В кроне:

*/10 * * * * /usr/bin/pgrep amsHelper || /usr/sbin/service hp-ams restart

Для гипервизоров ESXi я пока поступил следующим образом: перевёл мониторинг с SNMP на IPMI. При этом теряется autodiscovery и мониторинг жёстких дисков на некоторых конфигурациях серверов. Диски теперь мониторятся только через email-уведомления в ILO.

Теги

 

Похожие материалы

Zabbix — добавление элемента данных и триггера для HP MSA 2050

Появилась необходимость мониторить HP MSA 2050.  Я уже выкладывал Zabbix шаблон для мониторинга СХД - HP MSA 2040. Шаблон от HP MSA 2040 вполне подходит для мониторинга HP MSA 2050, но есть тонкость: в новом СХД добавились новые трапы. В этой статье я приведу пример, как добавить в шаблон новый неизвестный трап. Итак, от HP MSA 2050 пришёл неизвестный трап:

Zabbix шаблон для мониторинга СХД HP MSA 2040 и HP MSA 2050

Делюсь полезным шаблоном для мониторинга СХД HP MSA 2040 и HP MSA 2050. В шаблоне 580 элементов данных и 716 триггеров. Работает на основе получаемых от СХД SNMP traps.

Zabbix шаблон для мониторинга сервера HP Proliant DL580 Gen9

Делюсь полезным шаблоном для мониторинга сервера  HP Proliant DL580 Gen9. Мониторим по IPMI. Шаблон делал сам. Версия 2. В шаблоне 7 приложений, 97 элементов данных, 37 триггеров и 3 графика.

Теги