Переосмислення існуючого процесу завантаження та обробки даних як приклад ETL за допомогою pandas [ukr]
Презентація доповіді
ETL - це вилучення, перетворення, завантаження. Процес, який об’єднує дані з різних джерел в єдине сховище для подальшої їх обробки, аналізу та використання.
Ця доповідь надає приклад застосування pandas для вирішення задач ETL як етап еволюції компоненту data intake що передбачає попередню валідацію, фільтрації та конвертацію даних відповідно до набору бізнес-правил та внутрішнього представлення з проміжним поєднанням із іншими джерелами
Єгор Назаркін
Healthjoy Inc., Engineering Manager
- Підтримує набутий досвід розробника та архітектора у роботи з інженерними командами та розвитком продукту.
- Працює з людьми, бізнесом та технологіями для вирішення проблем при їх поєднанні.
- GitHub.