Як ми 72 години 5 секунд шукали [відеозапис]

Ця доповідь демонструє практичні підходи до unified observability, де метрики, логи, траси та профілі інтегровані для швидкої діагностики проблем у розподілених системах. Розглянемо техніки кореляції даних через traceId та лейбли для миттєвого переходу від помилок до конкретних span'ів, налаштування continuous profiling для preview-середовищ, використання flame charts для аналізу продуктивності, dependency maps і service graphs для візуалізації архітектури. Окрема увага приділена AI-специфічним аспектам: застосування AI-асистентів для автоматизації root cause analysis та впровадження AI Evals для систематичного оцінювання якості, коректності та надійності AI-систем.

Денис Васильєв

Principal Site Reliability Engineer / UK Global Talent Visa Holder

17+ років у індустрії: від інженера до CTO
Сертифікований opensource contributor
Спікер: Fwdays, Xpdays, DevOPSdays, DevOps-DEX London
Автор курсу Kubernetes DIY та серії курсів з AI Reliability Engineering
Автор та ведучий телеграм та YouTube каналу "[не]правильний DevOps"
LinkedIn