Книги / DevOps и Инфраструктура / Google Cloud Platform / Data Engineering with Google Cloud Platform

Data Engineering with Google Cloud Platform

Adi Wijaya

Эта книга представляет собой практическое руководство по созданию масштабируемых платформ данных с использованием Google Cloud Platform (GCP). Автор, Ади Виджая, стратегический облачный инженер данных в Google, делится своим десятилетним опытом работы с десятками организаций.

Книга охватывает ключевые сервисы GCP для инженерии данных: BigQuery для аналитики, Dataproc (Apache Spark) для обработки данных, Dataflow (Apache Beam) для потоковой обработки, Pub/Sub для сбора данных в реальном времени и Google Cloud Composer (Apache Airflow) для оркестрации DAG-зависимостей.

Читатели научатся создавать ETL/ELT-пайплайны, собирать, трансформировать и визуализировать данные из различных источников (пакетных и потоковых). Второе издание включает обновленные примеры и команды для практического применения.

Книга предназначена для инженеров данных, желающих повысить свою квалификацию и освоить стек Google Cloud для построения надежных и масштабируемых решений.