Hands-on Guide to Apache Spark 3: Build Scalable Computing Engines for Batch and Stream Data Processing

Эта книга представляет собой практическое руководство по работе с Apache Spark 3, мощным распределенным вычислительным движком для обработки больших данных. Автор подробно рассматривает архитектуру Spark, его основные компоненты и принципы работы, позволяя читателям глубоко понять систему.

Основное внимание уделяется построению масштабируемых вычислительных движков для пакетной и потоковой обработки данных. Книга разделена на две части: первая посвящена пакетной обработке, вторая — потоковой. Каждая глава содержит практические примеры и упражнения для закрепления материала.

Читатели научатся эффективно использовать Spark для решения реальных задач анализа данных, оптимизировать производительность приложений и работать с различными источниками данных. Особое внимание уделяется новым возможностям версии Spark 3, включая улучшения в SQL, структурированной потоковой обработке и интеграции с облачными платформами.

Книга подходит как для начинающих разработчиков данных, так и для опытных инженеров, желающих углубить свои знания в области распределенных вычислений и обработки больших данных с использованием современного стека технологий.

Hands-on Guide to Apache Spark 3: Build Scalable Computing Engines for Batch and Stream Data Processing
A
Автор
Alfonso Antolínez García
Издательство
Apress
Год
2023
Язык
Английский
1
Оцените книгу

Чтобы читать книгу, войдите или зарегистрируйтесь

Ознакомительный фрагмент