Эффективный Spark. Масштабирование и оптимизация
Эта книга предназначена для тех, кто уже имеет базовый опыт работы с Apache Spark, но хочет выйти на новый уровень производительности и масштабируемости. Авторы подробно объясняют, как эффективно использовать Spark для обработки больших данных, преодолевая типичные проблемы с производительностью и масштабированием.
Книга охватывает ключевые аспекты работы с Spark, включая внутреннее устройство фреймворка, работу с DataFrame/Dataset и Spark SQL, эффективные преобразования данных, операции с ключ-значение парами, а также использование Spark MLlib для машинного обучения. Особое внимание уделяется практическим приемам оптимизации и отладки.
Издание идеально подходит для программистов, инженеров по работе с данными и системных администраторов, обслуживающих крупномасштабные приложения. Книга поможет вырасти из новичка в специалиста, способного эффективно использовать Spark для решения сложных задач обработки больших данных.









