Обучение агентов в виртуальной среде KukaDiversObjectEnv

Bibliografiske detaljer
Parent link:Курзина, И. А. (химик ; 1972-). Перспективы развития фундаментальных наук=Prospects of Fundamental Sciences Development: сборник научных трудов XXI Международной конференции студентов, аспирантов и молодых ученых, г. Томск, 23-26 апреля 2024 г..— .— Томск: Изд-во ТПУ
Т. 7 : IT-технологии и электроника.— 2024.— С. 42-44
Hovedforfatter: Залогин Н. Е.
Institution som forfatter: Национальный исследовательский Томский политехнический университет (570)
Andre forfattere: Григорьев Д. С. Дмитрий Сергеевич (727)
Summary:Заглавие с экрана
The present study implements and compares the DQN, PPO, Parallel PPO, and Modified PPO algorithms in the PyBullet KukaDiverseObjectEnv environment. The algorithms are tested and evaluated in a simulated test mode to assess their performance. The experiments focus on metrics such as learning speed, stability, and task completion success rate. The results provide insights into the effectiveness of each algorithm in the tested environment, aiding in the optimization of reinforcement learning algorithms for complex environments and robotics
Текстовый файл
Sprog:russisk
Udgivet: 2024
Fag:
Online adgang:http://earchive.tpu.ru/handle/11683/80462
Format: Electronisk Book Chapter
KOHA link:https://koha.lib.tpu.ru/cgi-bin/koha/opac-detail.pl?biblionumber=674286

MARC

LEADER 00000naa2a2200000 4500
001 674286
005 20241004142908.0
090 |a 674286 
100 |a 20240829d2024 k||y0rusy50 ca 
101 0 |a rus 
102 |a RU 
135 |a drcn ---uucaa 
200 1 |a Обучение агентов в виртуальной среде KukaDiversObjectEnv  |d Training agents in a KukaDiversObjectEnv virtual environment  |f Н. Е. Залогин  |g науч. рук. Д. С. Григорьев ; Национальный исследовательский Томский политехнический университет  |z eng 
300 |a Заглавие с экрана 
320 |a Список литературы: 7 назв. 
330 |a The present study implements and compares the DQN, PPO, Parallel PPO, and Modified PPO algorithms in the PyBullet KukaDiverseObjectEnv environment. The algorithms are tested and evaluated in a simulated test mode to assess their performance. The experiments focus on metrics such as learning speed, stability, and task completion success rate. The results provide insights into the effectiveness of each algorithm in the tested environment, aiding in the optimization of reinforcement learning algorithms for complex environments and robotics 
336 |a Текстовый файл 
461 1 |0 674010  |t Перспективы развития фундаментальных наук  |l Prospects of Fundamental Sciences Development  |o сборник научных трудов XXI Международной конференции студентов, аспирантов и молодых ученых, г. Томск, 23-26 апреля 2024 г.  |9 674010  |a Курзина, И. А. (химик ; 1972-)  |c Томск  |n Изд-во ТПУ 
463 1 |0 674014  |t Т. 7 : IT-технологии и электроника  |v С. 42-44  |d 2024  |9 674014  |p 1 файл (31,4 MB, 190 с.)  |u conference_tpu-2024-C21_V7.pdf  |l Vol. 7 : IT-technologies and Electronics 
610 1 |a труды учёных ТПУ 
610 1 |a электронный ресурс 
610 1 |a reinforcement learning 
610 1 |a robotic arm 
610 1 |a PyBullet 
700 1 |a Залогин  |b Н. Е.  
702 1 |a Григорьев  |b Д. С.  |c специалист в области информатики и вычислительной техники  |c ассистент Томского политехнического университета  |f 1991-  |g Дмитрий Сергеевич  |4 727 
712 0 2 |a Национальный исследовательский Томский политехнический университет  |c (2009- )  |9 26305  |4 570 
801 0 |a RU  |b 63413507  |c 20240829  |g RCR 
856 4 |z http://earchive.tpu.ru/handle/11683/80462  |u http://earchive.tpu.ru/handle/11683/80462 
942 |c CF