Обучение с подкреплением для реальных задач. Инженерный подход
Книга посвящена промышленно-ориентированному применению обучения с подкреплением (Reinforcement Learning, RL). В ней объясняется, как обучать промышленные и научные системы решать пошаговые задачи методом проб и ошибок, избегая подготовки узкоспециализированных учебных наборов данных и рисков переобучения.
Рассматриваются ключевые теоретические концепции, такие как марковские процессы принятия решений, глубокие Q-сети, градиенты политик и методы устранения энтропии. Особое внимание уделяется практическому, инженерному подходу к реализации алгоритмов RL в реальных отраслевых проектах.
Издание позиционируется как первая на русском языке книга, где теоретический базис RL и алгоритмы представлены в прикладном, отраслевом ключе. Она предназначена для специалистов, стремящихся внедрить интеллектуальные агенты в промышленные системы.









