Интерпретируемое машинное обучение на Python
Книга посвящена интерпретации моделей машинного обучения — одной из ключевых тем современного AI. Автор подробно объясняет, почему важно понимать, как работают модели, и какие проблемы решает интерпретируемость.
В первой части дается введение в интерпретацию машинного обучения: раскрываются ключевые понятия, деловое обоснование и этические аспекты. Рассматриваются различия между интерпретируемостью и объяснимостью.
Вторая часть охватывает практические методы интерпретации: модельно-агностические подходы, якорные и контрфактические объяснения, методы для многопеременного прогнозирования, а также визуализацию сверточных нейронных сетей.
Третья часть посвящена настройке моделей на интерпретируемость: отбор и конструирование признаков, ослабление систематического смещения, причинно-следственный вывод, монотонные ограничения и устойчивость к антагонистическим атакам. Каждая глава содержит подробные примеры кода на Python.
