Scaling Python with Dask: From Data Science to Machine Learning

Holden Karau, Mika Kimmins

Книга «Scaling Python with Dask» представляет собой практическое руководство по использованию библиотеки Dask для параллельных вычислений в Python. Dask — это мощный инструмент с открытым исходным кодом, который позволяет эффективно распараллеливать задачи, используя возможности современных многоядерных процессоров и GPU, и масштабироваться до облачных сред для обработки больших объёмов данных.

Авторы, опытные инженеры данных Holden Karau и Mika Kimmins, подробно объясняют, как Dask интегрируется с популярными библиотеками экосистемы PyData, такими как NumPy, pandas и scikit-learn, предоставляя знакомые API для параллельной обработки. Книга охватывает ключевые концепции распределённых систем, необходимые для работы с Dask, и демонстрирует методы пакетной параллельной обработки данных.

Читатели узнают, как использовать Dask для решения задач Data Science и машинного обучения, работать с высокоуровневыми API и базовыми строительными блоками библиотеки, а также как задействовать GPU для ускорения вычислений. Издание основано на реальном опыте использования Dask в таких организациях, как Walmart, Capital One и NASA.

Книга предназначена для data scientists, инженеров данных и Python-разработчиков, которые сталкиваются с необходимостью обработки больших данных и хотят эффективно использовать вычислительные ресурсы без переписывания кода под другие фреймворки.

Похожие книги

Machine Learning and Data Science Blueprints for Finance: From Building Trading Strategies to Robo-Advisors Using Python

Hariom Tatsat, Sahil Puri, Brad Lookabaugh

Python for Data Science For Dummies, 3rd Edition

John Paul Mueller, Luca Massaron

Data Visualization with Python and JavaScript: Scrape, Clean, Explore, and Transform Your Data

Kyran Dale

Practical Data Science with Python 3: Synthesizing Actionable Insights from Data

Ervin Varga

Hands-On Machine Learning with Scikit-Learn and PyTorch: Concepts, Tools, and Techniques to Build Intelligent Systems

Aurélien Géron

Python Automation For Dummies

Alan Simpson

Python Adventures for Young Coders: Explore the World of Programming

Alaa Tharwat

Hands-On Prescriptive Analytics: Optimizing Your Decision Making with Python

Walter R. Paczkowski

Doing Math with Python: Use Programming to Explore Algebra, Statistics, Calculus, and More!

Amit Saha

Applied Data Science Using PySpark: Learn the End-to-End Predictive Model-Building Cycle, Second Edition

Ramcharan Kakarla, Sundar Krishnan, Balaji Dhamodharan, Venkata Gunnu