Modern Data Architectures with Python: A practical guide to building and deploying data pipelines, data warehouses, and data lakes with Python
Эта книга представляет собой практическое руководство по проектированию и развертыванию современных систем обработки данных с использованием Python. Автор, опытный инженер данных, рассматривает ключевые концепции и архитектуры, включая базы данных, хранилища данных, озера данных, а также такие современные подходы, как Lakehouse, Delta-архитектура и Data Mesh.
В первой части книги читатель знакомится с фундаментальными знаниями о данных, включая различия между OLTP и OLAP системами, форматами файлов и высокоуровневой архитектурой платформы данных. Подробно рассматриваются Lambda и Kappa архитектуры, их сравнение и практическое применение.
Особое внимание уделяется практическим аспектам: построению конвейеров данных, работе с хранилищами и озерами данных, использованию Python для решения реальных задач. Книга содержит лабораторные работы и примеры кода, помогающие закрепить полученные знания на практике.
Издание предназначено для инженеров данных, архитекторов и разработчиков, которые хотят освоить современные подходы к построению масштабируемых и эффективных систем обработки данных с использованием Python и сопутствующих технологий.









