Data Pipelines with Apache Airflow: Orchestration for Data and AI, Second Edition
Это второе издание практического руководства по Apache Airflow — ведущей платформе для оркестрации рабочих процессов в области данных и искусственного интеллекта. Книга начинается с основ: вы узнаете, что такое DAG (направленный ациклический граф), как писать и запускать простые пайплайны, а также освоите временное и событийное планирование задач.
По мере продвижения вы углубитесь в продвинутые темы: шаблонизацию задач с использованием контекста Airflow, определение сложных зависимостей между задачами, триггеры для внешнего ввода и интеграцию с внешними системами. Особое внимание уделяется расширению функциональности Airflow через создание собственных операторов и сенсоров.
Книга предназначена для инженеров данных, DevOps-специалистов и разработчиков AI-решений, которые хотят автоматизировать и масштабировать свои рабочие процессы. Второе издание обновлено с учетом последних версий Airflow и включает новые главы по оркестрации для AI и машинного обучения.
