Об обучении интеллектуальных агентов в виртуальной среде для задачи управления роботом-манипулятором; Известия Томского политехнического университета [Известия ТПУ]. Промышленная кибернетика; Т. 2, № 3

Bibliographische Detailangaben
Parent link:Известия Томского политехнического университета [Известия ТПУ]. Промышленная кибернетика: сетевое издание/ Национальный исследовательский Томский политехнический университет.— .— Томск: ТПУ, 2023-.— 2413-1830
Т. 2, № 3.— 2024.— С. 1-8
1. Verfasser: Залогин Н. Е. Никита Евгеньевич
Weitere Verfasser: Григорьев Д. С. Дмитрий Сергеевич
Zusammenfassung:Актуальность. Определяется необходимостью разработки эффективных методов обучения интеллектуальных агентов для задач управления роботами-манипуляторами в виртуальной среде, что критически важно для повышения точности и эффективности промышленных и исследовательских процессов в различных областях. Цель. Реализация, исследование и модификация алгоритмов обучения с подкреплением, таких как Deep Q-Network (DQN) и Proximal Policy Optimization (PPO), для управления агентами в виртуальной среде KukaDiverseObjectEnv на платформе PyBullet с целью создания моделей, способных точно и надежно взаимодействовать с объектами различных классов. Методы. Программирование, эксперименты и синтез, сравнительный анализ. Результаты и выводы. Проведён сравнительный анализ эффективности алгоритмов DQN и PPO, а также модификаций последнего для обучения агентов в конкретной виртуальной среде. Показано, что обученные агенты способны решать поставленную задачу, а модификации позволяют сократить время обучения и количество необходимых шагов в среде. В результате тестирования алгоритмы продемонстрировали приемлемую точность управления манипулятором, что подтверждается на 1000 тестовых эпизодов среды. Реализованные алгоритмы и разработанные модификации обладают потенциалом для использования в промышленных приложениях и дальнейшего развития в реальных условиях, что подчеркивает их значимость для современной робототехники и автоматизации
Relevance. The necessity for developing effective methods for training intelligent agents in robotic manipulator control tasks in a virtual environment is critically important for enhancing the accuracy and efficiency of industrial and research processes across various fields. Aim. Implementation, investigation and modification of reinforcement learning algorithms, such as Deep Q-Network and Proximal Policy Optimization, to manage agents in the KukaDiverseObjectEnv virtual environment on the PyBullet platform in order to create models that can accurately and reliably interact with objects of different classes. Methods. Programming, experimentation and synthesis, and comparative analysis. Results and conclusions. The authors have carried out comparative analysis of the effectiveness of Deep Q-Network and Proximal Policy Optimization algorithms, as well as modifications of the Proximal Policy Optimization for training agents in a particular virtual environment. It was shown that trained agents are able to solve the assigned task, and modifications can reduce the training time and the number steps required in the environment. As a result of testing, the algorithms demonstrated acceptable accuracy in manipulator control, which is validated on 1000 test episodes of the environment. The implemented algorithms and developed modifications have the potential to be used in industrial applications and further development in real-world conditions, which highlights their importance for modern robotics and automation
Текстовый файл
Sprache:Russisch
Veröffentlicht: 2024
Schlagworte:
Online-Zugang:https://earchive.tpu.ru/handle/11683/82206
https://doi.org/10.18799/29495407/2024/3/61
Format: Elektronisch Buchkapitel
KOHA link:https://koha.lib.tpu.ru/cgi-bin/koha/opac-detail.pl?biblionumber=675959

MARC

LEADER 00000naa2a2200000 4500
001 675959
005 20250117175444.0
090 |a 675959 
100 |a 20241028d2024 k||y0rusy50 ca 
101 0 |a rus 
102 |a RU 
135 |a drcn ---uucaa 
200 1 |a Об обучении интеллектуальных агентов в виртуальной среде для задачи управления роботом-манипулятором  |d On training intelligent agents in a virtual environment for the robot manipulator control task  |z eng  |f Никита Евгеньевич Залогин, Дмитрий Сергеевич Григорьев 
320 |a Список литературы: с. 7-8 (22 назв.) 
330 |a Актуальность. Определяется необходимостью разработки эффективных методов обучения интеллектуальных агентов для задач управления роботами-манипуляторами в виртуальной среде, что критически важно для повышения точности и эффективности промышленных и исследовательских процессов в различных областях. Цель. Реализация, исследование и модификация алгоритмов обучения с подкреплением, таких как Deep Q-Network (DQN) и Proximal Policy Optimization (PPO), для управления агентами в виртуальной среде KukaDiverseObjectEnv на платформе PyBullet с целью создания моделей, способных точно и надежно взаимодействовать с объектами различных классов. Методы. Программирование, эксперименты и синтез, сравнительный анализ. Результаты и выводы. Проведён сравнительный анализ эффективности алгоритмов DQN и PPO, а также модификаций последнего для обучения агентов в конкретной виртуальной среде. Показано, что обученные агенты способны решать поставленную задачу, а модификации позволяют сократить время обучения и количество необходимых шагов в среде. В результате тестирования алгоритмы продемонстрировали приемлемую точность управления манипулятором, что подтверждается на 1000 тестовых эпизодов среды. Реализованные алгоритмы и разработанные модификации обладают потенциалом для использования в промышленных приложениях и дальнейшего развития в реальных условиях, что подчеркивает их значимость для современной робототехники и автоматизации 
330 |a Relevance. The necessity for developing effective methods for training intelligent agents in robotic manipulator control tasks in a virtual environment is critically important for enhancing the accuracy and efficiency of industrial and research processes across various fields. Aim. Implementation, investigation and modification of reinforcement learning algorithms, such as Deep Q-Network and Proximal Policy Optimization, to manage agents in the KukaDiverseObjectEnv virtual environment on the PyBullet platform in order to create models that can accurately and reliably interact with objects of different classes. Methods. Programming, experimentation and synthesis, and comparative analysis. Results and conclusions. The authors have carried out comparative analysis of the effectiveness of Deep Q-Network and Proximal Policy Optimization algorithms, as well as modifications of the Proximal Policy Optimization for training agents in a particular virtual environment. It was shown that trained agents are able to solve the assigned task, and modifications can reduce the training time and the number steps required in the environment. As a result of testing, the algorithms demonstrated acceptable accuracy in manipulator control, which is validated on 1000 test episodes of the environment. The implemented algorithms and developed modifications have the potential to be used in industrial applications and further development in real-world conditions, which highlights their importance for modern robotics and automation 
336 |a Текстовый файл 
461 1 |0 672190  |9 672190  |t Известия Томского политехнического университета [Известия ТПУ]. Промышленная кибернетика  |o сетевое издание  |f Национальный исследовательский Томский политехнический университет  |c Томск  |n ТПУ  |d 2023-  |x 2413-1830 
463 1 |0 675939  |9 675939  |t Т. 2, № 3  |d 2024  |v С. 1-8 
610 1 |a электронный ресурс 
610 1 |a труды учёных ТПУ 
610 1 |a обучение с подкреплением 
610 1 |a виртуальная среда 
610 1 |a Deep Q-network 
610 1 |a Proximal policy optimization 
610 1 |a робот-манипулятор 
610 1 |a робототехника 
610 1 |a reinforcement learning 
610 1 |a virtual environment 
610 1 |a robot manipulator 
610 1 |a robotics 
700 1 |a Залогин  |b Н. Е.  |c инженер Томского политехнического университета  |c магистр направления Программная инженерия  |g Никита Евгеньевич  |9 88714 
701 1 |a Григорьев  |b Д. С.  |c специалист в области информатики и вычислительной техники  |c ассистент Томского политехнического университета  |f 1991-  |g Дмитрий Сергеевич  |9 22545 
801 0 |a RU  |b 63413507  |c 20241028 
850 |a 63413507 
856 4 |u https://earchive.tpu.ru/handle/11683/82206  |z https://earchive.tpu.ru/handle/11683/82206 
856 4 |u https://doi.org/10.18799/29495407/2024/3/61  |z https://doi.org/10.18799/29495407/2024/3/61 
942 |c CF