Эффективный Spark. Масштабирование и оптимизация

Эта книга предназначена для тех, кто уже имеет базовый опыт работы с Apache Spark, но хочет выйти на новый уровень производительности и масштабируемости. Авторы подробно объясняют, как эффективно использовать Spark для обработки больших данных, преодолевая типичные проблемы с производительностью и масштабированием.

Книга охватывает ключевые аспекты работы с Spark, включая внутреннее устройство фреймворка, работу с DataFrame/Dataset и Spark SQL, эффективные преобразования данных, операции с ключ-значение парами, а также использование Spark MLlib для машинного обучения. Особое внимание уделяется практическим приемам оптимизации и отладки.

Издание идеально подходит для программистов, инженеров по работе с данными и системных администраторов, обслуживающих крупномасштабные приложения. Книга поможет вырасти из новичка в специалиста, способного эффективно использовать Spark для решения сложных задач обработки больших данных.

Похожие книги

Эффективный Spark. Масштабирование и оптимизация
A
Автор
Холден Карау, Рейчел Уоррен
Издательство
Питер
Год
2018
Язык
Русский
1
Оцените книгу

Чтобы читать книгу, войдите или зарегистрируйтесь

Ознакомительный фрагмент