Фільтр по тегу

Agent in the Loop: Architecture for Highload Data Pipeline Recovery [ukr]

Практико-орієнтована архітектурна доповідь про інтеграцію AI-агента в операційний workflow highload data pipeline. Розглянемо сценарій каскадного збою: у пайплайн потрапляють пошкоджені дані, зависають черги Kafka, зростає навантаження на storage, тисячі Kubernetes pod’ів починають падати та пересоздаватися, деградує etcd, а PostgreSQL стає додатковою точкою навантаження. Також покажемо, як AI-агент, побудований на базі AWS Bedrock AgentCore, LangChain та MCP/Gateway, може виявляти ранні сигнали інцидентів, ізолювати corrupted messages, пропонувати human-approved remediation steps, захищати стабільність кластера та перетворювати noisy telemetry на конкретні кроки для відновлення системи.

Кирило Дубовик

(AI Solutions Architect at EPAM Systems | Founder “Digital Brain”),

Максим Бородін

(Systems Architect @ EPAM),
Конференція Highload fwdays'26
High-load ≠ high-cost: як оптимізувати інфраструктуру без втрати reliability [ukr]

У High-Load системах вартість інфраструктури часто зростає не через саме навантаження, а через неефективні архітектурні рішення: overprovisioning, надмірне використання managed-сервісів, зайвий data movement, неправильні SLA-рішення та відсутність прозорої cost-моделі. На конференції поговоримо, як підходити до cost optimization як до повноцінної архітектурної практики, а не як до разового скорочення ресурсів. Також поговоримо про аналіз workload profile, пошук реальних bottleneck’ів, побудову unit economics для інфраструктури, оптимізацію трафіку, кешування, CDN, observability та контрольовану деградацію сервісів. Окремо розберемо trade-off між performance, reliability та cost: де потрібна максимальна відмовостійкість, де достатньо eventually consistent підходу, а де managed-рішення варто замінити простішою self-hosted архітектурою.

Ігор Закутинський

(CTO, FORMA, Universe Group),
Конференція Highload fwdays'26
From Logging Chaos to Controlled Pipelines [ukr]

Це історія про реальний біль і дорослішання системи логування. Ми подивимось, як відсутність стандартів ламають observability. Я покажу, чому Kubernetes став точкою неповернення і змусив нас переглянути підхід до логів. Розберемо вимоги та архітектурні рішення, які дозволили повернути контроль. Поділюсь практичним досвідом побудови керованих лог-пайплайнів без магії і “чарівних інструментів”. Це чесна історія з продакшну.

Олександр Шевченко

(DevOps Engineer, ONSEO),
Конференція DevOps fwdays'26
Як ми 72 години 5 секунд шукали [відеозапис]

Ця доповідь демонструє практичні підходи до unified observability, де метрики, логи, траси та профілі інтегровані для швидкої діагностики проблем у розподілених системах. Розглянемо техніки кореляції даних через traceId та лейбли для миттєвого переходу від помилок до конкретних span'ів, налаштування continuous profiling для preview-середовищ, використання flame charts для аналізу продуктивності, dependency maps і service graphs для візуалізації архітектури. Окрема увага приділена AI-специфічним аспектам: застосування AI-асистентів для автоматизації root cause analysis та впровадження AI Evals для систематичного оцінювання якості, коректності та надійності AI-систем.

Денис Васильєв

(Principal Site Reliability Engineer / UK Global Talent Visa Holder),
Конференція DevOps fwdays'26
Відчуття проти фактів: чому метрики важливіші за інтуїцію [ukr]

Ми звикли довіряти відчуттям: здається, що процеси працюють, а продукт якісний. Але відчуття не масштабуються. У цій доповіді я покажу, як ми перейшли від інтуїтивних рішень до системи метрик, яка вимірює якість продуктів і процесів у реальному часі. Як команди, маючи «приборну панель», самі керують розвитком своїх продуктів із точки зору якості. І головне — як технічні метрики стають зрозумілими бізнесу, допомагають говорити про ризики однією мовою й приймати рішення на масштабі.

Ігор Дрозд

(CTO, Silpo(E-commerce)),
Конференція CTO fwdays'25
Validation and Observability of AI Agents [ukr]

Розкажу про валідацію та моніторинг AI-агентів на прикладі мобільного додатку, що працює з мультиагентною системою через OpenAPI. Продемонструю практичні підходи до тестування логіки агентів, методи збору метрик їхньої роботи та налаштування observability системи. Поділюся досвідом відстеження поведінки агентів у реальному часі, виявлення аномалій та забезпечення надійності мультиагентної архітектури в продакшені.

Олександр Денисюк

(СТО в Укрпошта),
Fwdays+DevRain AI
Побудова Observability з Elasticsearch: практики для високих навантажень[ukr]

Поговоримо про архітектурні рішення, які дозволяють Elasticsearch залишатися стабільним під високим навантаженням: правильна організація індексів і шардів, політики ILM, використання persistent queues у Logstash, даунсемплінг метрик та моніторинг самої observability-системи. Поділюся досвідом побудови надійної платформи з терабайтами логів і мільйонами подій на день.

Антон Приходько

(EPAM, Systems Architect),
Конференція Highload fwdays'25
Увійти
Або поштою
Увійти
Або поштою
Реєстрація через e-mail
Реєстрація через e-mail
Забули пароль?