Перейти к основному содержанию

Zabbix server: Utilization of trapper processes over 75%

Zabbix

С ростом инфраструктуры нагрузка на Zabbix сервер растёт. Вы можете встретить ошибку:

Zabbix server: Utilization of trapper processes over 75%

Посмотрим график Zabbix server: Utilization of trapper data collector processes, in %

zabbix

Видим что утилизация в какой-то момент превысила 75%, в принципе, ничего страшного. Обычно в такой ситуации, если график более-менее ровный, нужно добавить поллеров.

Редактируем параметр StartTrappers в /etc/zabbix/zabbix_server.conf. По умолчанию StartTrappers=5, меняю на StartTrappers=10.

zabbix

Перезагружаем службу zabbix-server:

service zabbix-server restart

В большинстве случаев это поможет.

Но у меня резкий рост графика, добавление трапперов не решило проблему. А проблема оказалась в DNS, который стал долго отвечать.

Каждое входящее соединение от агента запускало на сервере цепочку операций, многие из которых требовали обратного DNS-разрешения (PTR-записи). Сервер получает соединение и пытается определить имя хоста через gethostbyaddr(). Ждет ответа от DNS... 5 секунд... 10 секунд... таймаут... Только потом обрабатывает запрос и возвращает ошибку host not found, что можно увидеть в логах Zabbix. При нормальном DNS эти операции занимают миллисекунды. При медленном DNS — секунды. 

Теги

 

Похожие материалы

Zabbix шаблон для мониторинга стоечного переключателя APC Rack ATS

Делюсь полезным шаблоном для мониторинга стоечного переключателя APC Rack ATS. Мониторим по SNMP. Шаблон делал сам. К шаблону прилинкован другой встроенный шаблон: "Template SNMP Device". В шаблоне 4 приложения, 18 элементов данных, 4 триггера, 2 графика, 1 правило обнаружения, 8 прототипов элементов данных, 1 прототип триггера, 1 прототип графика.

Теги