Глубокое обучение с подкреплением на Python. OpenAI Gym и TensorFlow для профи

Уведоми ме, когато книгата е добавена

Глубокое обучение с подкреплением (Reinforcement Learning) — самое популярное и перспективное направление искусственного интеллекта. Практическое изучение RL на Python поможет освоить не только базовые, но и передовые алгоритмы глубокого обучения с подкреплением. Вы начнете с основных принципов обучения с подкреплением, OpenAI Gym и TensorFlow, познакомьтесь с марковскими цепями, методом Монте-Карло и динамическим программированием, так что «страшные» аббревиатуры DQN, DRQN, A3C, PPO и TRPO вскоре перестанут вас пугать. Вы узнаете об агентах, которые учатся на человеческих предпочтениях, DQfD, HER и многих других последних достижениях RL. Прочитав книгу, вы приобретете знания и опыт, необходимые для реализации обучения с подкреплением и глубокого обучения с подкреплением в реальных проектах, и войдете в мир искусственного интеллекта. В этой книге вы: • Познакомитесь с основами методов, алгоритмов и элементов RL • Обучите агента с помощью OpenAI Gym и Tensorflow • Освоите марковские процессы принятия решений, оптимальность Беллмана и обучение TD • Научитесь решать проблемы многоруких бандитов • Овладеете алгоритмами глубокого обучения, такими как RNN, LSTM и CNN • Создадите интеллектуальных агентов с помощью алгоритма DRQN, которые смогут играть в Doom • С помощью DDPG научите агентов играть в Lunar Lander • Отправите агента на автогонки, используя метод DQN

повече

Тази книга не е налична в момента

506 печатни страници

Подобни книгиВсички

Цитати

Elena Levinaцитирапреди 3 години
Когда мы говорим о «решении задач MDP», на самом деле имеется в виду задача нахождения оптимальных функций политики и ценности.
- Харесва ми
- Коментар
- Споделяне
  Facebook
  Twitter
  Копиране на линка
- Съобщете за това
Дмитрий Орловцитирапреди 4 години
При неконтролируемом обучении модель изучает скрытую структуру, тогда как в RL модель учится на максимизации наград.
- Харесва ми
- Коментар
- Споделяне
  Facebook
  Twitter
  Копиране на линка
- Съобщете за това

На лавиците

Oleg K.
АйТи
- 21
- 6
Прекратяване на следването
Daria Lebedeva
программирование
- 3
- 2
Прекратяване на следването
Владимир Шнайдер
Python
- 5
- 1
Прекратяване на следването
Андрей
1
- 101
Прекратяване на следването
Kirill Kruglikov
Data science
- 15
Прекратяване на следването