Spark в действии. С примерами на Java, Python и Scala

Эта книга представляет собой подробное руководство по аналитической операционной системе Apache Spark 3. Она научит вас создавать полноценные аналитические приложения для обработки больших данных. В качестве практического примера используется полный конвейер обработки данных, поступающих со спутников NASA.

Книга тщательно описывает процессы потребления, преобразования и публикации результатов обработки данных. Демонстрируются возможности Apache Spark при работе с разнообразными форматами исходных данных: текстом, JSON, XML, СУБД и многими другими. Особое внимание уделяется обработке потоковых данных, что крайне важно в современных условиях.

Подробно рассмотрены организация и архитектура кластера Spark. Издание содержит множество иллюстраций и примеров исходного кода на языке Java с подробными комментариями, а также предоставляет исходный код на Java, Python и Scala. Для чтения книги не требуется предварительный опыт работы со Spark, Scala или Hadoop.

Spark в действии. С примерами на Java, Python и Scala
A
Автор
Жан-Жорж Перрен
Издательство
ДМК Пресс
Год
2021
Язык
Русский
1
Оцените книгу

Чтобы читать книгу, войдите или зарегистрируйтесь

Ознакомительный фрагмент