Python Data Cleaning Cookbook. Second Edition. Prepare your data for analysis with pandas, NumPy, Matplotlib, scikit-learn, and OpenAI
Второе издание практического руководства по очистке и подготовке данных для анализа и машинного обучения с использованием Python. Книга представляет собой сборник рецептов, охватывающих весь процесс работы с данными — от импорта из различных источников (CSV, Excel, SQL, SPSS, Stata, SAS, R, HTML, JSON) до их персистентного хранения.
Основное внимание уделяется использованию библиотек pandas, NumPy, Matplotlib и scikit-learn для решения типичных задач очистки: обработки пропущенных значений, исправления ошибок в данных, преобразования типов, нормализации и создания признаков. Особенностью второго издания является интеграция инструментов OpenAI для расширения возможностей автоматической обработки и анализа.
Книга ориентирована на практикующих специалистов по данным, аналитиков и разработчиков, которые хотят систематизировать свои знания в области подготовки данных. Автор, Майкл Уокер, делится своим 37-летним опытом работы аналитиком и преподавателем, предлагая проверенные методики и решения реальных проблем, возникающих при работе с "грязными" наборами данных.









