Предварительная подготовка данных в Python. Том 2: План, примеры и метрики качества

А. В. Груздев

Второй том двухтомного издания, посвящённого применению классических методов машинного обучения в промышленных задачах. Книга фокусируется на ключевом этапе любого ML-проекта — предварительной подготовке данных. Автор подробно рассматривает процесс формирования выборки, определение зависимой переменной, работу с «окнами выборки» и «окнами созревания».

В практической части освещаются основные техники обработки данных: загрузка из CSV и SQL-источников, удаление бесполезных и рискованных переменных, преобразование типов и шкал, нормализация строк, обработка дубликатов, редких категорий и пропусков. Отдельное внимание уделяется работе с выбросами, вычислению описательных статистик и анализу распределений.

Издание содержит примеры использования полезных библиотек и фреймворков, таких как H2O, Dask, Docker и Google Colab, что делает материал применимым в современных производственных средах. Книга рассчитана на специалистов по анализу данных и будет полезна всем, кто интересуется практическими аспектами машинного обучения.

Похожие книги

Предварительная подготовка данных в Python. Том 1. Инструменты и валидация

А. В. Груздев

Изучаем Pandas

Майкл Хейдт, Артем Груздев

Сверхбыстрый Python. Эффективные техники для работы с большими наборами данных

Тиаго Антао

Рецепты Python. Коллекция лучших техник программирования

Юн Цуй

Python. Системный анализ данных, расчеты и моделирование

Иоаким Сунднес

Python и анализ данных. Первичная обработка данных с применением pandas, NumPy и Jupyter

Уэс Маккинни

Python для сложных задач: наука о данных. 2-е междунар. изд.

Джейк Вандер Плас

Введение в машинное обучение с помощью Python. Руководство для специалистов по работе с данными

Андреас Мюллер, Сара Гвидо

Python. Книга рецептов

Дэвид Бизли, Брайан К. Джонс

Python: Pandas на практике. 200 упражнений по анализу данных с решениями и пояснениями

Реувен Лернер