Книги / AI и ML / Data Science / Эффективный Spark. Масштабирование и оптимизация

Эффективный Spark. Масштабирование и оптимизация

Холден Карау, Рейчел Уоррен

Эта книга предназначена для тех, кто уже имеет базовый опыт работы с Apache Spark, но хочет выйти на новый уровень производительности и масштабируемости. Авторы подробно объясняют, как эффективно использовать Spark для обработки больших данных, преодолевая типичные проблемы с производительностью и масштабированием.

Книга охватывает ключевые аспекты работы с Spark, включая внутреннее устройство фреймворка, работу с DataFrame/Dataset и Spark SQL, эффективные преобразования данных, операции с ключ-значение парами, а также использование Spark MLlib для машинного обучения. Особое внимание уделяется практическим приемам оптимизации и отладки.

Издание идеально подходит для программистов, инженеров по работе с данными и системных администраторов, обслуживающих крупномасштабные приложения. Книга поможет вырасти из новичка в специалиста, способного эффективно использовать Spark для решения сложных задач обработки больших данных.

Похожие книги