Як ми 72 години 5 секунд шукали [відеозапис]
Ця доповідь демонструє практичні підходи до unified observability, де метрики, логи, траси та профілі інтегровані для швидкої діагностики проблем у розподілених системах. Розглянемо техніки кореляції даних через traceId та лейбли для миттєвого переходу від помилок до конкретних span'ів, налаштування continuous profiling для preview-середовищ, використання flame charts для аналізу продуктивності, dependency maps і service graphs для візуалізації архітектури. Окрема увага приділена AI-специфічним аспектам: застосування AI-асистентів для автоматизації root cause analysis та впровадження AI Evals для систематичного оцінювання якості, коректності та надійності AI-систем.
Денис Васильєв
Principal Site Reliability Engineer / UK Global Talent Visa Holder
- 17+ років у індустрії: від інженера до CTO
- Сертифікований opensource contributor
- Спікер: Fwdays, Xpdays, DevOPSdays, DevOps-DEX London
- Автор курсу Kubernetes DIY та серії курсів з AI Reliability Engineering
- Автор та ведучий телеграм та YouTube каналу "[не]правильний DevOps"