Приоритет событий (уровень важности сообщений) в мониторинге и логах
Приоритеты события определяют важность событий. Для системы мониторинга они определяют необходимость дополнительных уведомлений по почте, sms.
За основу была взята nix-овая линейка NOTHING, DEBUG, INFO, NOTICE, WARNING (warn), ERROR (err), CRITICAL (crit), ALERT, EMERGENCY. Хотя поначалу она казалась избыточной.
| Приоритет | Описание | Логи и оповещения | |
|---|---|---|---|
| 8 | NOTHING | Пустое сообщение. | В логах такие события не сохраняются. Оповещения не создаются |
| 7 | DEBUG | Для сообщений, необходимых только при отладке программы | В логах хранятся временно. Оповещения не создаются |
| 6 | INFO | Информационные сообщения, не являющиеся ошибочными | Оповещения не создаются |
| 5 | NOTICE | Небольшое предупреждение, восклицание. Для ситуаций, не являющихся ошибочными, но требующих особого внимания | Оповещения не создаются |
| 4 | WARNING | Предупреждающее сообщение, небольшая ошибка | Оповещения создаются для специального почтового ящика для оповещений |
| 3 | ERROR | Сообщение об ошибке. Сбои в работе некритичных программ, модулей. | Создаются email оповещения для основного почтового ящика, и возможно, sms-уведомление |
| 2 | CRITICAL | Сообщения о больших ошибках, критических ситуациях | Создаются email оповещения для основного почтового ящика, и sms-уведомление |
| 1 | ALERT | Сообщения о проблемах, которые надо немедленно решать. | Создаются email оповещения для основного почтового ящика как администратора, так и его начальника; обязательны sms-уведомления |
| 0 | EMERGENCY | "Всё пропало" :) | Сообщение в криминальной сводке |
В небольших проектах неясной является разница между CRITICAL и ALERT. Наличие EMERGENCY и NOTICE тоже под вопросом. Однако при настройке уведомлений такое количество статусов удобно:
Для уведомлений в моей конфигурации назначены 3 почтовых ящика и 2 телефона для смс.
Первый, личный, телефон отвечает только за сбои уровня «alert» (самый высокий для системы). Второй, рабочий телефон, получает смс о меньших, но тоже важных сбоях «critical». Рабочий телефон в нерабочее время стоит на вибре и не отвлекает. Однако если проблема доростает до уровня «alert» – зазвенит личный.
Аналогично и с почтой. На основной email приходят уведомления о сбоях alert и critical, второй – дублирует + события error. На третий, «мусорный» ящик, приходят все события, включая уведомления с более низкими статусами «warning» и «notify».
Такая система позволяет получать информацию ненавязчиво и реагировать по мере возможности.
Из поста система мониторинга
Исходник:
define('STATUS_NOTHING', 8);
define('STATUS_DEBUG', 7);
define('STATUS_INFO', 6);
define('STATUS_NOTICE', 5);
define('STATUS_WARNING', 4);
define('STATUS_ERROR', 3);
define('STATUS_CRITICAL', 2);
define('STATUS_ALERT', 1);
define('STATUS_EMERGENCY', 0);