Як ми 72 години 5 секунд шукали [відеозапис]

Ця доповідь демонструє практичні підходи до unified observability, де метрики, логи, траси та профілі інтегровані для швидкої діагностики проблем у розподілених системах. Розглянемо техніки кореляції даних через traceId та лейбли для миттєвого переходу від помилок до конкретних span'ів, налаштування continuous profiling для preview-середовищ, використання flame charts для аналізу продуктивності, dependency maps і service graphs для візуалізації архітектури. Окрема увага приділена AI-специфічним аспектам: застосування AI-асистентів для автоматизації root cause analysis та впровадження AI Evals для систематичного оцінювання якості, коректності та надійності AI-систем.

Денис Васильєв
Principal Site Reliability Engineer / UK Global Talent Visa Holder
  • 17+ років у індустрії: від інженера до CTO
  • Сертифікований opensource contributor
  • Спікер: Fwdays, Xpdays, DevOPSdays, DevOps-DEX London
  • Автор курсу Kubernetes DIY та серії курсів з AI Reliability Engineering
  • Автор та ведучий телеграм та YouTube каналу "[не]правильний DevOps"
  • LinkedIn
Увійти
Або поштою
Увійти
Або поштою
Реєстрація через e-mail
Реєстрація через e-mail
Забули пароль?