Книги / AI и ML / Data Science / Spark для профессионалов: современные паттерны обработки больших данных

Spark для профессионалов: современные паттерны обработки больших данных

Сэнди Риза, Ури Лезерсон, Шон Оуэн, Джош Уиллс

Эта практичная книга, написанная четырьмя специалистами Cloudera по анализу данных, представляет собой руководство по выполнению крупномасштабного анализа данных с использованием Apache Spark. Авторы комплексно рассматривают возможности Spark, статистические методы и реальные наборы данных, демонстрируя решения распространенных аналитических проблем.

Книга охватывает ключевые темы анализа больших данных: от введения в Scala и Spark до конкретных кейсов, таких как рекомендация музыки, прогнозирование лесного покрова, обнаружение аномалий сетевого трафика, латентно-семантический анализ, анализ сетей с GraphX, работа с геопространственными и временными данными, моделирование финансовых рисков и анализ геномных данных.

Издание содержит подробные примеры кода и практические паттерны, которые помогут профессионалам эффективно применять Spark для решения сложных задач анализа данных в реальных проектах.

Похожие книги