Big Monitoring Meetup #8

6 видео, 6 презентаций

Встречаемся в Московском офисе Тинькофф на восьмой встрече посвященной технологиям мониторинга — разработке, настройке и эксплуатации.


Следите за анонсами в Телеграме.
 

Дата и время

10 декабря 2022, 14:00 МСК

Доклады

Reliability Engineering до появления SRE
Немного расскажу про проявления физического мира и как они мешают технике работать, какие технологии и механизмы придумывали инженеры на самых разных уровнях: от транзистора в процессоре до сложных комплексных систем, вроде СХД или даже ЦОДа, для того, чтобы все это надежно работало и не ломалось слишком часто.
Лев Алимов
Тинькофф
Построение комплексного мониторинга ЦОД для чайников
Часто ли специалисты, организующие мониторинг, задаются вопросом "что именно надо мониторить в нашем случае и почему?". В докладе предлагается "волшебная формула мониторинга", зная которую можно как построить эффективный мониторинг с нуля, так и усовершенствовать уже существующий.
Константин Струлёв
Россинно
Почему SRE должен уметь читать код
На примере реальных сбоев с Elastic и VictoriaMetrics разберем как работают некоторые вещи "под капотом".
Максим Ванюшкин
Тинькофф
Автоматизация управления zabbix через внешнее API
Использование внешнего API для гибкого управления мониторингом интерфейсов и bgp, препроцессинг и оверрайд в темплейтах snmp-discovery.
Дмитрий Соседский
Selectel
Визуализация топологий на основе данных мониторинга
Сатистическая топология не работает! Но альтернатива есть. Доклад про построение динамической топологии сетей и сервисов. Визуализация и метрики пользовательских сценариев.
Михаил Макуров
glaber.io
SLI/SLO/SLA: измерение надёжности системы
Всё больше и больше приложений уходят из монолита в микросервисы. Микросервисов становится много, и зоны ответственности размываются. Становится сложно понять, как подсчитать надёжность приложения и как она коррелирует с микросервисами.
Павел Лакосников
Авито

Видео