Эффективный Spark. Масштабирование и оптимизация

Холден Карау, Рейчел Уоррен

Эта книга предназначена для тех, кто уже имеет базовый опыт работы с Apache Spark, но хочет выйти на новый уровень производительности и масштабируемости. Авторы подробно объясняют, как эффективно использовать Spark для обработки больших данных, преодолевая типичные проблемы с производительностью и масштабированием.

Книга охватывает ключевые аспекты работы с Spark, включая внутреннее устройство фреймворка, работу с DataFrame/Dataset и Spark SQL, эффективные преобразования данных, операции с ключ-значение парами, а также использование Spark MLlib для машинного обучения. Особое внимание уделяется практическим приемам оптимизации и отладки.

Издание идеально подходит для программистов, инженеров по работе с данными и системных администраторов, обслуживающих крупномасштабные приложения. Книга поможет вырасти из новичка в специалиста, способного эффективно использовать Spark для решения сложных задач обработки больших данных.

Похожие книги

Spark в действии. С примерами на Java, Python и Scala

Жан-Жорж Перрен

Обработка больших данных с Apache Spark

Н. А. Бутаков, М. В. Петров, Д. Насонов

Грокаем функциональное программирование

Михал Плахта

Эффективный Java. Тюнинг кода на Java 8, 11 и дальше. Второе издание

Скотт Оукс

Эффективный Node.js. От базовых навыков к профессиональной разработке

Самер Буна

Джоэл: и снова о программировании. Новые мысли о разнообразных и иногда родственных вопросах, которые должны быть интересны разработчикам программного обеспечения, проектировщикам и менеджерам, а также тем, кому посчастливилось или не повезло в каком-то качестве работать с ними

Джоэл Спольски

Python – к вершинам мастерства: Лаконичное и эффективное программирование

Лусиану Рамальо

От Java к Kotlin

Дункан Макгрегор, Нэт Прайс

Expert Python Programming. Third Edition

Michal Jaworski, Tarek Ziade

Эффективная работа с унаследованным кодом

Майкл К. Физерс