Data Engineering with Scala and Spark
Эта книга представляет собой практическое руководство по созданию конвейеров обработки данных с использованием Scala и Apache Spark. Она охватывает как потоковую, так и пакетную обработку больших объемов данных, начиная с основ Scala для инженеров данных и заканчивая настройкой облачной среды. Авторы, имеющие многолетний опыт работы с данными, делятся лучшими практиками построения масштабируемых решений.
Книга начинается с введения в функциональное программирование на Scala, включая работу с классами, объектами, трейтами, функциями высшего порядка и паттерн-матчингом. Затем рассматривается настройка облачной инфраструктуры и использование объектного хранилища. Основное внимание уделяется практическим аспектам инженерии данных: созданию надежных и эффективных конвейеров.
Издание предназначено для инженеров данных, желающих освоить современные инструменты обработки данных. Оно содержит множество примеров кода и реальных сценариев использования. Книга будет полезна как новичкам в Scala, так и опытным специалистам, стремящимся углубить свои знания в области распределенных вычислений.










