Machine Learning for Tabular Data: XGBoost, Deep Learning, and AI
Эта книга представляет собой практическое руководство по применению машинного обучения для работы с табличными данными. Авторы подробно рассматривают как классические алгоритмы, так и современные методы глубокого обучения, уделяя особое внимание особенностям структурированных данных.
В первой части книги вводятся основные понятия табличных данных, их характеристики и отличия от других типов данных. Рассматриваются методы исследования и подготовки датасетов, включая обработку пропущенных значений, выявление аномалий и работу с категориальными признаками.
Вторая часть посвящена классическим алгоритмам машинного обучения и градиентному бустингу, с особым акцентом на XGBoost. Авторы демонстрируют передовые методы обработки признаков и приводят сквозной пример использования XGBoost для решения реальных задач.
Третья часть охватывает глубокое обучение для табличных данных: от основ нейронных сетей до лучших практик их применения. Рассматриваются вопросы развертывания моделей, построения ML-пайплайнов и комбинирования методов градиентного бустинга с глубоким обучением для достижения максимальной эффективности.









