Managing Datasets and Models
Книга «Managing Datasets and Models» представляет собой практическое руководство по управлению данными и моделями в контексте Data Science и машинного обучения. Автор, Освальд Кампесато, фокусируется на ключевых аспектах работы с данными: от первоначального исследования и очистки до подготовки датасетов для обучения моделей.
В книге подробно рассматриваются методы исследовательского анализа данных (EDA), включая визуализацию, обнаружение аномалий и обработку пропущенных значений. Особое внимание уделяется практическим проблемам, которые возникают при работе с реальными данными, и способам их решения с использованием современных инструментов и библиотек.
Издание охватывает весь цикл работы с данными: сбор, очистку, трансформацию, разделение на выборки и подготовку для машинного обучения. Книга содержит множество примеров кода и практических советов, которые помогут читателям эффективно управлять датасетами и создавать качественные модели машинного обучения.
Материал будет полезен как начинающим специалистам в области Data Science, так и опытным практикам, которые хотят систематизировать свои знания по управлению данными и моделями. Книга служит мостом между теоретическими основами машинного обучения и практической реализацией проектов.









