Как быстрее и точнее выявлять сбои, снижать шум от алертов и сокращать бизнес-риски? Рассказала команда GMONIT
Инженер предпродажной подготовки GMONIT Антон Пасюк рассказал о современных подходах к мониторингу и управлению инцидентами. Участники узнали, как трансформируется процесс работы с алертами в контексте растущей сложности ИТ-ландшафта.
Спикер пояснил, что системы генерируют десятки уведомлений в Telegram, Slack, почту или ITSM-систему, и команды часто теряются в потоке сигналов. Приходит множество уведомлений об ошибках баз данных, CPU или HTTP 500, невозможно понять, где начало проблемы, отсутствует единый контекст, а поиск первопричины сбоя затягивается, что ведет к высокому MTTR.
В продолжение темы Антон разобрал «анатомию» инцидента и логику его жизненного цикла.
Особое внимание эксперт уделил архитектуре observability платформы и показал, как GMONIT собирает данные через мобильные, браузерные, APM, инфраструктурные, SAP и 1С-агенты, выстраивая связи между событиями. Логическим развитием этого подхода стала разработка Карточки инцидента GMONIT – нового функционала, который собирает всю телеметрию в одном интерфейсе и превращает хаотичный поток данных в структурированный контекст.
Также GMONIT делает работу с SLO простой и наглядной. Для быстрого старта доступны готовые шаблоны SLO для APM, инфраструктуры и frontend, которые настраиваются всего в три клика. Визуализация «Бюджета ошибок» переводит технические метрики на язык бизнеса, показывая руководству, сколько времени сервис может оставаться недоступным, не нарушая обязательств перед пользователями.
Бонусом Антон поделился roadmap Карточки инцидента GMONIT, которые сделают работу со сбоями еще более интеллектуальной и автоматизированной:
-
Интеграция с ITSM. Бесшовный экспорт инцидентов в ServiceDesk.
-
ML-корреляция и приоритизация. Автоматическая группировка сотен алертов в один инцидент.
-
Память системы («Похожие инциденты»). Платформа узнает проблемы, которые уже случались ранее.
-
Дефолтные «Умные» Паки. Zero-config мониторинг и готовый набор алертов с выверенными порогами.
В финальной части вебинара состоялась QA-сессия, где участники получили ответы на свои вопросы.
Предлагаем к просмотру видеозапись выступления:
Лучшее в блогах
Вам понравится
Елена Новоселова, директор по инновациям SPLAT Global, стала гостем подкаста «Нас этому не учили». Получился разговор о химии, физике и о том, почему чистить зубы ребенку — это как целиться в раскачивающуюся тыкву.
«Мой опыт доказывает, что слова Сократа “Я знаю, что ничего не знаю” актуальны для любого начинания. Расскажу о том, как этот подход помог мне в работе, когда нужно было не только собрать команду аналитики и выстроить все процессы с нуля, но и начать быстро показывать результаты», — делимся колонкой Максима Калацкого, руководителя управления рекламной аналитики Магнит ADS.
Неделя рекламы
Энциклопедия обмана