Книги / AI и ML / Data Science / Data Engineering with Scala and Spark

Data Engineering with Scala and Spark

Eric Tome, Rupam Bhattacharjee, David Radford

Эта книга представляет собой практическое руководство по созданию конвейеров обработки данных с использованием Scala и Apache Spark. Она охватывает как потоковую, так и пакетную обработку больших объемов данных, начиная с основ Scala для инженеров данных и заканчивая настройкой облачной среды. Авторы, имеющие многолетний опыт работы с данными, делятся лучшими практиками построения масштабируемых решений.

Книга начинается с введения в функциональное программирование на Scala, включая работу с классами, объектами, трейтами, функциями высшего порядка и паттерн-матчингом. Затем рассматривается настройка облачной инфраструктуры и использование объектного хранилища. Основное внимание уделяется практическим аспектам инженерии данных: созданию надежных и эффективных конвейеров.

Издание предназначено для инженеров данных, желающих освоить современные инструменты обработки данных. Оно содержит множество примеров кода и реальных сценариев использования. Книга будет полезна как новичкам в Scala, так и опытным специалистам, стремящимся углубить свои знания в области распределенных вычислений.