На докладах секции «Наблюдаемость и Operational Intelligence» мы рассмотрим ключевые аспекты мониторинга и анализа систем, которые позволяют обеспечивать высокую надежность и производительность приложений. Доклады, о которых рассказываем сегодня будут особенно интересны для инженеров эксплуатации, разработчиков, технических директоров, владельцев продуктов и специалистов сопровождения.
-
Интерпретация данных мониторинга на базе TSDB: ключевые ошибки и решения на примере Prometheus. Владимир Гурьянов (Флант)
В докладе рассмотрим, что на самом деле скрывается за графиками и как не поддаться «иллюзиям», которые они могут создавать. Обсудим, почему визуализированные метрики могут дать искажённое представление о реальности. Погрузимся в архитектурные особенности систем мониторинга на примере Prometheus. Поговорим о том, как «проснуться» и начать воспринимать метрики систем мониторинга правильно. А также разберём особенности, которые надо учитывать, чтобы не попадать в ловушки ложного восприятия. -
Укрощение хаоса логов с помощью модели OpenTelemetry, Vector и ClickHouse, итоги за два года. Дмитрий Синявский (Ви.Tech)
Vector, Kafka, ClickHouse уже вполне обкатанный стек, но каким образом внутри этого стека провести оптимизацию, с какими проблемами при этом можно столкнуться и как их решить. -
Семплирование трейсов изнутри. Что скрывается под вершиной айсберга?. Антон Новоженин (GMonit)
Этот доклад будет полезен тем, кто хочет более детально разобраться в механизмах обработки трейсов, как они обрабатываются под нагрузкой и какие подводные камни могут возникнуть в процессе. -
Система без теней: Полный цикл наблюдаемости в современных приложениях. Александр Козлов (СберТех)
В докладе рассмотрим, как построить современную систему наблюдаемости от уровня кода до систем кластерного уровня, что и на каких этапах необходимо реализовывать. Тех стек в докладе будет Java и Go, но полученные знания применить и реализовать вы сможете на любой системе, которая у вас под рукой — принципы те же. Также рассмотрим различные принципы сбора телеметрии для систем, откуда и какие данные мы сможем достать без модификации приложения.
Встречаемся 7 и 8 апреля в Москве на DevOpsConf 2025 🙌