Приоритет событий (уровень важности сообщений) в мониторинге и логах

Приоритеты события определяют важность событий. Для системы мониторинга они определяют необходимость дополнительных уведомлений по почте, sms.
За основу была взята nix-овая линейка NOTHING, DEBUG, INFO, NOTICE, WARNING (warn), ERROR (err), CRITICAL (crit), ALERT, EMERGENCY. Хотя поначалу она казалась избыточной.

Приоритет Описание Логи и оповещения
8 NOTHING Пустое сообщение. В логах такие события не сохраняются. Оповещения не создаются
7 DEBUG Для сообщений, необходимых только при отладке программы В логах хранятся временно. Оповещения не создаются
6 INFO Информационные сообщения, не являющиеся ошибочными Оповещения не создаются
5 NOTICE Небольшое предупреждение, восклицание. Для ситуаций, не являющихся ошибочными, но требующих особого внимания Оповещения не создаются
4 WARNING Предупреждающее сообщение, небольшая ошибка Оповещения создаются для специального почтового ящика для оповещений
3 ERROR Сообщение об ошибке. Сбои в работе некритичных программ, модулей. Создаются email оповещения для основного почтового ящика, и возможно, sms-уведомление
2 CRITICAL Сообщения о больших ошибках, критических ситуациях Создаются email оповещения для основного почтового ящика, и sms-уведомление
1 ALERT Сообщения о проблемах, которые надо немедленно решать. Создаются email оповещения для основного почтового ящика как администратора, так и его начальника; обязательны sms-уведомления
0 EMERGENCY «Всё пропало» :) Сообщение в криминальной сводке

В небольших проектах неясной является разница между CRITICAL и ALERT. Наличие EMERGENCY и NOTICE тоже под вопросом. Однако при настройке уведомлений такое количество статусов удобно:

Для уведомлений в моей конфигурации назначены 3 почтовых ящика и 2 телефона для смс.
Первый, личный, телефон отвечает только за сбои уровня «alert» (самый высокий для системы). Второй, рабочий телефон, получает смс о меньших, но тоже важных сбоях «critical». Рабочий телефон в нерабочее время стоит на вибре и не отвлекает. Однако если проблема доростает до уровня «alert» – зазвенит личный.
Аналогично и с почтой. На основной email приходят уведомления о сбоях alert и critical, второй – дублирует + события error. На третий, «мусорный» ящик, приходят все события, включая уведомления с более низкими статусами «warning» и «notify».
Такая система позволяет получать информацию ненавязчиво и реагировать по мере возможности.

Из поста система мониторинга

Исходник:

define(‘STATUS_NOTHING’, 8);
define(‘STATUS_DEBUG’, 7);
define(‘STATUS_INFO’, 6);
define(‘STATUS_NOTICE’, 5);
define(‘STATUS_WARNING’, 4);
define(‘STATUS_ERROR’, 3);
define(‘STATUS_CRITICAL’, 2);
define(‘STATUS_ALERT’, 1);
define(‘STATUS_EMERGENCY’, 0);

Похожие записи:

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *