Data Engineering with Google Cloud Platform
Эта книга представляет собой практическое руководство по созданию масштабируемых платформ данных с использованием Google Cloud Platform (GCP). Автор, Ади Виджая, стратегический облачный инженер данных в Google, делится своим десятилетним опытом работы с десятками организаций.
Книга охватывает ключевые сервисы GCP для инженерии данных: BigQuery для аналитики, Dataproc (Apache Spark) для обработки данных, Dataflow (Apache Beam) для потоковой обработки, Pub/Sub для сбора данных в реальном времени и Google Cloud Composer (Apache Airflow) для оркестрации DAG-зависимостей.
Читатели научатся создавать ETL/ELT-пайплайны, собирать, трансформировать и визуализировать данные из различных источников (пакетных и потоковых). Второе издание включает обновленные примеры и команды для практического применения.
Книга предназначена для инженеров данных, желающих повысить свою квалификацию и освоить стек Google Cloud для построения надежных и масштабируемых решений.










