Applied Data Science Using PySpark: Learn the End-to-End Predictive Model-Building Cycle, Second Edition
Эта книга представляет собой практическое руководство по применению Data Science с использованием фреймворка PySpark. Второе издание полностью обновлено и охватывает весь цикл построения прогнозных моделей — от начальной настройки среды до развертывания готовых решений.
Основное внимание уделяется практическому применению PySpark для решения реальных задач анализа данных и машинного обучения. Авторы демонстрируют, как эффективно использовать распределенные вычисления для обработки больших объемов данных, что особенно актуально в эпоху Big Data.
Книга последовательно проводит читателя через все этапы работы с данными: сбор и подготовку данных, исследовательский анализ, проектирование признаков, построение и оценку моделей машинного обучения, а также их внедрение в производство. Особое внимание уделяется особенностям работы с PySpark в сравнении с традиционными подходами.
Издание содержит множество практических примеров и кода, которые помогут как начинающим, так и опытным специалистам в Data Science освоить эффективное использование PySpark для решения сложных аналитических задач. Книга также затрагивает вопросы мониторинга моделей и поддержки ML-систем в production-среде.









