Управление движением объекта по полю с препятствиями при помощи рекуррентной нейронной сети
Аннотация
Рассматриваются модели управления рекуррентной нейронной сетью движением объекта по полю с препятствиями. С помощью генетического алгоритма созданы две нейронные сети разной сложности. Для каждой сети описаны алгоритмы обучения с подкреплением. Проводятся сравнения эффективности их работы.
Литература
A. N. Chernodub and D. A. Dzyuba, “Review of neurocontrol methods,” Problemy programmirovaniya, no. 2, pp. 79–94, 2011 (in Russian).
D. Kopec, Classic Computer Science Problems in Python, St. Petersburg, Russia: Piter, 2020 (in Russian).
G. A. Kilin and E. O. Zhdanovsky, “Benefits of using reinforcement learning for training neural networks,” in Proc. Review of Automated control systems and information technologies neurocontrol methods, Perm, Russia, 17 May 2018, Perm, Russia: Perm National Research Polytechnic University, vol. 1, 2018, pp. 152–158 (in Russian).
J. Prateek, Artificial intelligence with Python, St. Petersburg, Russia: OOO "Dialektika 2019 (in Russian).
S. I. Nikolenko and A. L. Tulup’ev, Self-learning systems, Moscow: MCCME, 2009 (in Russian).
S. Nikolenko, A. Kadurin, and E. Arkhangelskaya, Deep learning, St. Petersburg, Russia: Piter, 2018 (in Russian).
I. Goodfellow, Y. Bengio, and A. Courville, Deep Learning, Moscow: DMK Press, 2018 (in Russian).
Материал публикуется под лицензией: