Scaling Python with Dask: From Data Science to Machine Learning
Книга «Scaling Python with Dask» представляет собой практическое руководство по использованию библиотеки Dask для параллельных вычислений в Python. Dask — это мощный инструмент с открытым исходным кодом, который позволяет эффективно распараллеливать задачи, используя возможности современных многоядерных процессоров и GPU, и масштабироваться до облачных сред для обработки больших объёмов данных.
Авторы, опытные инженеры данных Holden Karau и Mika Kimmins, подробно объясняют, как Dask интегрируется с популярными библиотеками экосистемы PyData, такими как NumPy, pandas и scikit-learn, предоставляя знакомые API для параллельной обработки. Книга охватывает ключевые концепции распределённых систем, необходимые для работы с Dask, и демонстрирует методы пакетной параллельной обработки данных.
Читатели узнают, как использовать Dask для решения задач Data Science и машинного обучения, работать с высокоуровневыми API и базовыми строительными блоками библиотеки, а также как задействовать GPU для ускорения вычислений. Издание основано на реальном опыте использования Dask в таких организациях, как Walmart, Capital One и NASA.
Книга предназначена для data scientists, инженеров данных и Python-разработчиков, которые сталкиваются с необходимостью обработки больших данных и хотят эффективно использовать вычислительные ресурсы без переписывания кода под другие фреймворки.









