Spark в действии. С примерами на Java, Python и Scala
Эта книга представляет собой подробное руководство по аналитической операционной системе Apache Spark 3. Она научит вас создавать полноценные аналитические приложения для обработки больших данных. В качестве практического примера используется полный конвейер обработки данных, поступающих со спутников NASA.
Книга тщательно описывает процессы потребления, преобразования и публикации результатов обработки данных. Демонстрируются возможности Apache Spark при работе с разнообразными форматами исходных данных: текстом, JSON, XML, СУБД и многими другими. Особое внимание уделяется обработке потоковых данных, что крайне важно в современных условиях.
Подробно рассмотрены организация и архитектура кластера Spark. Издание содержит множество иллюстраций и примеров исходного кода на языке Java с подробными комментариями, а также предоставляет исходный код на Java, Python и Scala. Для чтения книги не требуется предварительный опыт работы со Spark, Scala или Hadoop.









