Spark для профессионалов: современные паттерны обработки больших данных

Эта практичная книга, написанная четырьмя специалистами Cloudera по анализу данных, представляет собой руководство по выполнению крупномасштабного анализа данных с использованием Apache Spark. Авторы комплексно рассматривают возможности Spark, статистические методы и реальные наборы данных, демонстрируя решения распространенных аналитических проблем.

Книга охватывает ключевые темы анализа больших данных: от введения в Scala и Spark до конкретных кейсов, таких как рекомендация музыки, прогнозирование лесного покрова, обнаружение аномалий сетевого трафика, латентно-семантический анализ, анализ сетей с GraphX, работа с геопространственными и временными данными, моделирование финансовых рисков и анализ геномных данных.

Издание содержит подробные примеры кода и практические паттерны, которые помогут профессионалам эффективно применять Spark для решения сложных задач анализа данных в реальных проектах.

Похожие книги

Spark для профессионалов: современные паттерны обработки больших данных
A
Автор
Сэнди Риза, Ури Лезерсон, Шон Оуэн, Джош Уиллс
Издательство
Питер
Год
2017
Язык
Русский
1
Оцените книгу

Чтобы читать книгу, войдите или зарегистрируйтесь

Ознакомительный фрагмент