Алгоритмы обучения с подкреплением на Python. Описание и разработка алгоритмов искусственного интеллекта

Эта книга представляет собой практическое руководство по освоению и реализации алгоритмов обучения с подкреплением (Reinforcement Learning, RL) с использованием языка Python. Автор подробно рассматривает ключевые элементы RL, включая стратегии, функции ценности, модели и системы вознаграждений, а также демонстрирует их применение для создания самообучающихся агентов искусственного интеллекта.

Вторая и третья части книги посвящены детальному разбору современных алгоритмов. Читатель научится сочетать Q-обучение с нейронными сетями для решения сложных задач, освоит методы градиента стратегии, а также такие продвинутые алгоритмы, как TRPO, PPO, DDPG и TD3. Особое внимание уделяется повышению производительности и устойчивости моделей.

Книга также охватывает смежные темы: технику подражательного обучения, алгоритмы исследования на основе верхней доверительной границы (UCB, UCB1) и метаалгоритм ESBAS. Издание содержит практические примеры работы со средой OpenAI Gym, что позволяет сразу применять полученные знания на практике. Книга предназначена для разработчиков, исследователей в области ИИ и всех, кто хочет с нуля освоить обучение с подкреплением, имея базовые навыки программирования на Python.

Похожие книги

Алгоритмы обучения с подкреплением на Python. Описание и разработка алгоритмов искусственного интеллекта
A
Автор
Андреа Лонца
Издательство
ДМК Пресс
Год
2020
Язык
Русский
1
Оцените книгу

Чтобы читать книгу, войдите или зарегистрируйтесь

Ознакомительный фрагмент