Applied Data Science Using PySpark: Learn the End-to-End Predictive Model-Building Cycle, Second Edition

Эта книга представляет собой практическое руководство по применению Data Science с использованием фреймворка PySpark. Второе издание полностью обновлено и охватывает весь цикл построения прогнозных моделей — от начальной настройки среды до развертывания готовых решений.

Основное внимание уделяется практическому применению PySpark для решения реальных задач анализа данных и машинного обучения. Авторы демонстрируют, как эффективно использовать распределенные вычисления для обработки больших объемов данных, что особенно актуально в эпоху Big Data.

Книга последовательно проводит читателя через все этапы работы с данными: сбор и подготовку данных, исследовательский анализ, проектирование признаков, построение и оценку моделей машинного обучения, а также их внедрение в производство. Особое внимание уделяется особенностям работы с PySpark в сравнении с традиционными подходами.

Издание содержит множество практических примеров и кода, которые помогут как начинающим, так и опытным специалистам в Data Science освоить эффективное использование PySpark для решения сложных аналитических задач. Книга также затрагивает вопросы мониторинга моделей и поддержки ML-систем в production-среде.

Applied Data Science Using PySpark: Learn the End-to-End Predictive Model-Building Cycle, Second Edition
A
Автор
Ramcharan Kakarla, Sundar Krishnan, Balaji Dhamodharan, Venkata Gunnu
Издательство
Apress
Год
2024
Язык
Английский
1
Оцените книгу

Чтобы читать книгу, войдите или зарегистрируйтесь

Ознакомительный фрагмент