Инженерия данных в Python: Основы анализа данных с помощью Pandas, NumPy и Scikit-learn
Эта книга посвящена ключевым аспектам подготовки и преобразования сырых данных для последующего анализа и машинного обучения. Основное внимание уделяется практическим техникам работы с данными с использованием популярных библиотек Python: Pandas, NumPy и Scikit-learn. Авторы рассматривают процесс придания данным структуры, пригодной для интеллектуального анализа, включая конструирование новых признаков и оптимизацию типов данных.
Издание охватывает как фундаментальные концепции промежуточного анализа данных, так и более сложные методы манипулирования данными. Примеры кода демонстрируют эффективные приёмы обработки данных любого объёма, начиная от заполнения пропущенных значений и вычисления скользящих средних до построения эффективных конвейеров обработки.
Книга предназначена для широкого круга читателей: от начинающих специалистов в области data science, делающих первые шаги в освоении науки о данных, до практикующих инженеров данных и аналитиков, желающих систематизировать и улучшить свои навыки работы с данными в Python.









