Об обучении интеллектуальных агентов в виртуальной среде для задачи управления роботом-манипулятором; Известия Томского политехнического университета [Известия ТПУ]. Промышленная кибернетика; Т. 2, № 3

Bibliographische Detailangaben
Parent link:	Известия Томского политехнического университета [Известия ТПУ]. Промышленная кибернетика: сетевое издание/ Национальный исследовательский Томский политехнический университет.— .— Томск: ТПУ, 2023-.— 2413-1830 Т. 2, № 3.— 2024.— С. 1-8
1. Verfasser:	Залогин Н. Е. Никита Евгеньевич
Weitere Verfasser:	Григорьев Д. С. Дмитрий Сергеевич
Zusammenfassung:	Актуальность. Определяется необходимостью разработки эффективных методов обучения интеллектуальных агентов для задач управления роботами-манипуляторами в виртуальной среде, что критически важно для повышения точности и эффективности промышленных и исследовательских процессов в различных областях. Цель. Реализация, исследование и модификация алгоритмов обучения с подкреплением, таких как Deep Q-Network (DQN) и Proximal Policy Optimization (PPO), для управления агентами в виртуальной среде KukaDiverseObjectEnv на платформе PyBullet с целью создания моделей, способных точно и надежно взаимодействовать с объектами различных классов. Методы. Программирование, эксперименты и синтез, сравнительный анализ. Результаты и выводы. Проведён сравнительный анализ эффективности алгоритмов DQN и PPO, а также модификаций последнего для обучения агентов в конкретной виртуальной среде. Показано, что обученные агенты способны решать поставленную задачу, а модификации позволяют сократить время обучения и количество необходимых шагов в среде. В результате тестирования алгоритмы продемонстрировали приемлемую точность управления манипулятором, что подтверждается на 1000 тестовых эпизодов среды. Реализованные алгоритмы и разработанные модификации обладают потенциалом для использования в промышленных приложениях и дальнейшего развития в реальных условиях, что подчеркивает их значимость для современной робототехники и автоматизации Relevance. The necessity for developing effective methods for training intelligent agents in robotic manipulator control tasks in a virtual environment is critically important for enhancing the accuracy and efficiency of industrial and research processes across various fields. Aim. Implementation, investigation and modification of reinforcement learning algorithms, such as Deep Q-Network and Proximal Policy Optimization, to manage agents in the KukaDiverseObjectEnv virtual environment on the PyBullet platform in order to create models that can accurately and reliably interact with objects of different classes. Methods. Programming, experimentation and synthesis, and comparative analysis. Results and conclusions. The authors have carried out comparative analysis of the effectiveness of Deep Q-Network and Proximal Policy Optimization algorithms, as well as modifications of the Proximal Policy Optimization for training agents in a particular virtual environment. It was shown that trained agents are able to solve the assigned task, and modifications can reduce the training time and the number steps required in the environment. As a result of testing, the algorithms demonstrated acceptable accuracy in manipulator control, which is validated on 1000 test episodes of the environment. The implemented algorithms and developed modifications have the potential to be used in industrial applications and further development in real-world conditions, which highlights their importance for modern robotics and automation Текстовый файл
Sprache:	Russisch
Veröffentlicht:	2024
Schlagworte:	электронный ресурс труды учёных ТПУ обучение с подкреплением виртуальная среда Deep Q-network Proximal policy optimization робот-манипулятор робототехника reinforcement learning virtual environment robot manipulator robotics
Online-Zugang:	https://earchive.tpu.ru/handle/11683/82206 https://doi.org/10.18799/29495407/2024/3/61
Format:	Elektronisch Buchkapitel
KOHA link:	https://koha.lib.tpu.ru/cgi-bin/koha/opac-detail.pl?biblionumber=675959

MARC


LEADER	00000naa2a2200000 4500
001	675959
005	20250117175444.0
090			\|a 675959
100			\|a 20241028d2024 k\|\|y0rusy50 ca
101	0		\|a rus
102			\|a RU
135			\|a drcn ---uucaa
200	1		\|a Об обучении интеллектуальных агентов в виртуальной среде для задачи управления роботом-манипулятором \|d On training intelligent agents in a virtual environment for the robot manipulator control task \|z eng \|f Никита Евгеньевич Залогин, Дмитрий Сергеевич Григорьев
320			\|a Список литературы: с. 7-8 (22 назв.)
330			\|a Актуальность. Определяется необходимостью разработки эффективных методов обучения интеллектуальных агентов для задач управления роботами-манипуляторами в виртуальной среде, что критически важно для повышения точности и эффективности промышленных и исследовательских процессов в различных областях. Цель. Реализация, исследование и модификация алгоритмов обучения с подкреплением, таких как Deep Q-Network (DQN) и Proximal Policy Optimization (PPO), для управления агентами в виртуальной среде KukaDiverseObjectEnv на платформе PyBullet с целью создания моделей, способных точно и надежно взаимодействовать с объектами различных классов. Методы. Программирование, эксперименты и синтез, сравнительный анализ. Результаты и выводы. Проведён сравнительный анализ эффективности алгоритмов DQN и PPO, а также модификаций последнего для обучения агентов в конкретной виртуальной среде. Показано, что обученные агенты способны решать поставленную задачу, а модификации позволяют сократить время обучения и количество необходимых шагов в среде. В результате тестирования алгоритмы продемонстрировали приемлемую точность управления манипулятором, что подтверждается на 1000 тестовых эпизодов среды. Реализованные алгоритмы и разработанные модификации обладают потенциалом для использования в промышленных приложениях и дальнейшего развития в реальных условиях, что подчеркивает их значимость для современной робототехники и автоматизации
330			\|a Relevance. The necessity for developing effective methods for training intelligent agents in robotic manipulator control tasks in a virtual environment is critically important for enhancing the accuracy and efficiency of industrial and research processes across various fields. Aim. Implementation, investigation and modification of reinforcement learning algorithms, such as Deep Q-Network and Proximal Policy Optimization, to manage agents in the KukaDiverseObjectEnv virtual environment on the PyBullet platform in order to create models that can accurately and reliably interact with objects of different classes. Methods. Programming, experimentation and synthesis, and comparative analysis. Results and conclusions. The authors have carried out comparative analysis of the effectiveness of Deep Q-Network and Proximal Policy Optimization algorithms, as well as modifications of the Proximal Policy Optimization for training agents in a particular virtual environment. It was shown that trained agents are able to solve the assigned task, and modifications can reduce the training time and the number steps required in the environment. As a result of testing, the algorithms demonstrated acceptable accuracy in manipulator control, which is validated on 1000 test episodes of the environment. The implemented algorithms and developed modifications have the potential to be used in industrial applications and further development in real-world conditions, which highlights their importance for modern robotics and automation
336			\|a Текстовый файл
461		1	\|0 672190 \|9 672190 \|t Известия Томского политехнического университета [Известия ТПУ]. Промышленная кибернетика \|o сетевое издание \|f Национальный исследовательский Томский политехнический университет \|c Томск \|n ТПУ \|d 2023- \|x 2413-1830
463		1	\|0 675939 \|9 675939 \|t Т. 2, № 3 \|d 2024 \|v С. 1-8
610	1		\|a электронный ресурс
610	1		\|a труды учёных ТПУ
610	1		\|a обучение с подкреплением
610	1		\|a виртуальная среда
610	1		\|a Deep Q-network
610	1		\|a Proximal policy optimization
610	1		\|a робот-манипулятор
610	1		\|a робототехника
610	1		\|a reinforcement learning
610	1		\|a virtual environment
610	1		\|a robot manipulator
610	1		\|a robotics
700		1	\|a Залогин \|b Н. Е. \|c инженер Томского политехнического университета \|c магистр направления Программная инженерия \|g Никита Евгеньевич \|9 88714
701		1	\|a Григорьев \|b Д. С. \|c специалист в области информатики и вычислительной техники \|c ассистент Томского политехнического университета \|f 1991- \|g Дмитрий Сергеевич \|9 22545
801		0	\|a RU \|b 63413507 \|c 20241028
850			\|a 63413507
856	4		\|u https://earchive.tpu.ru/handle/11683/82206 \|z https://earchive.tpu.ru/handle/11683/82206
856	4		\|u https://doi.org/10.18799/29495407/2024/3/61 \|z https://doi.org/10.18799/29495407/2024/3/61
942			\|c CF

MARC

Ähnliche Einträge