Архив метки: мониторинг

Приоритет событий (уровень важности сообщений) в мониторинге и логах

Приоритеты события определяют важность событий. Для системы мониторинга они определяют необходимость дополнительных уведомлений по почте, sms.
За основу была взята nix-овая линейка NOTHING, DEBUG, INFO, NOTICE, WARNING (warn), ERROR (err), CRITICAL (crit), ALERT, EMERGENCY. Хотя поначалу она казалась избыточной.

Читать далее

Сервис мониторинга почты (проверка работы почтового ящика)

Отдельно и на базе мониторинга WD был сделан мониторинг работы почты. Мониторинг почты представляет собой круглосуточную проверку работоспособности почтовых ящиков.

Не секрет, что задержка важного письма может быть весьма критичной для бизнеса. Ситуация «мы отправили вам письмо два часа назад, вы еще не получили? O_o» знакома? :)

Сбои в почте случаются намного чаще чем их замечают.

Реализация. Сервис мониторинга почты (сам или через релеи) отправляет «проверочные письма» на проверяемые почтовые ящики. Программа на конечной машине/сервере проверяет почту, получает проверочные письма и отправляет уведомления обратно системе мониторинга по http-протоколу.

Сбои в почте могут быть на стороне почтового сервера, офисного сервера, почтового клиента. Поскольку проверочные письма проходят по всей цепочке — они однозначно могут давать информацию о сбоях. Можно даже прицепить к The Bat-у.

Сервис мониторинга почты присылает уведомления о сбоях на почту или в виде sms на телефон администратора.

В онлайн-виде для клиента интерфейс мониторинга выглядит так:

Мониторинг работы почты (проверка работы почтового ящика)

(20-минутная «стучалка» для почты «кластера»)

Как я делал мониторинг

Часть лирическая. Комментированием «отладочных» строчек исходников обычно и заканчивается основная работа над проектом. На этот раз проект был жутко размазан во времени на два месяца и пересекался с другими. Но наконец он завершен, можно вздохнуть спокойно… и начать получать профит.
Мониторинг — признак зрелости, завершённости структуры. Созданием мониторинга своего айтишного «хозяйства» закрываю некую «главу».

Часть нетехническая.
Итак, мониторинг. В общем жить можно и без него. Просто узнавать о больших сбоях по возмущенным крикам/просьбам/мольбам по телефону или почте. А о маленьких и не догадываться. В итоге — убытки, нервы и репутация, в конце концов. Отсутствие мониторинга это типичная ситуация по той простой причине что обычно руки до этого не доходят. Хотя нет, вру. Просто всем пофиг. Админам, разработчикам, пользователям.

Что делает система мониторинга? Она опрашивает все системы: сервера, программы, сервисы, базы данных. В случае выявления нарушений в работе оповещает соответствующих людей в удобной для этого форме. О проблеме администратор или разработчик узнаёт оперативно и может решить ее еще до того как организация начнет терять из-за этого деньги.

Часть техническая.
Какие интересные вопросы решены при разработке:
Читать далее