Spark для профессионалов: современные паттерны обработки больших данных
Эта практичная книга, написанная четырьмя специалистами Cloudera по анализу данных, представляет собой руководство по выполнению крупномасштабного анализа данных с использованием Apache Spark. Авторы комплексно рассматривают возможности Spark, статистические методы и реальные наборы данных, демонстрируя решения распространенных аналитических проблем.
Книга охватывает ключевые темы анализа больших данных: от введения в Scala и Spark до конкретных кейсов, таких как рекомендация музыки, прогнозирование лесного покрова, обнаружение аномалий сетевого трафика, латентно-семантический анализ, анализ сетей с GraphX, работа с геопространственными и временными данными, моделирование финансовых рисков и анализ геномных данных.
Издание содержит подробные примеры кода и практические паттерны, которые помогут профессионалам эффективно применять Spark для решения сложных задач анализа данных в реальных проектах.









