Инженерия данных в Python: Основы анализа данных с помощью Pandas, NumPy и Scikit-learn

Эта книга посвящена ключевым аспектам подготовки и преобразования сырых данных для последующего анализа и машинного обучения. Основное внимание уделяется практическим техникам работы с данными с использованием популярных библиотек Python: Pandas, NumPy и Scikit-learn. Авторы рассматривают процесс придания данным структуры, пригодной для интеллектуального анализа, включая конструирование новых признаков и оптимизацию типов данных.

Издание охватывает как фундаментальные концепции промежуточного анализа данных, так и более сложные методы манипулирования данными. Примеры кода демонстрируют эффективные приёмы обработки данных любого объёма, начиная от заполнения пропущенных значений и вычисления скользящих средних до построения эффективных конвейеров обработки.

Книга предназначена для широкого круга читателей: от начинающих специалистов в области data science, делающих первые шаги в освоении науки о данных, до практикующих инженеров данных и аналитиков, желающих систематизировать и улучшить свои навыки работы с данными в Python.

Похожие книги

Инженерия данных в Python: Основы анализа данных с помощью Pandas, NumPy и Scikit-learn
A
Автор
А. Ю. Гинько (переводчик)
Издательство
ДМК Пресс
Год
2025
Язык
Русский
1
Оцените книгу

Чтобы читать книгу, войдите или зарегистрируйтесь

Ознакомительный фрагмент