Обучение агентов в виртуальной среде KukaDiversObjectEnv
| Parent link: | Курзина, И. А. (химик ; 1972-). Перспективы развития фундаментальных наук=Prospects of Fundamental Sciences Development: сборник научных трудов XXI Международной конференции студентов, аспирантов и молодых ученых, г. Томск, 23-26 апреля 2024 г..— .— Томск: Изд-во ТПУ Т. 7 : IT-технологии и электроника.— 2024.— С. 42-44 |
|---|---|
| Hovedforfatter: | |
| Institution som forfatter: | |
| Andre forfattere: | |
| Summary: | Заглавие с экрана The present study implements and compares the DQN, PPO, Parallel PPO, and Modified PPO algorithms in the PyBullet KukaDiverseObjectEnv environment. The algorithms are tested and evaluated in a simulated test mode to assess their performance. The experiments focus on metrics such as learning speed, stability, and task completion success rate. The results provide insights into the effectiveness of each algorithm in the tested environment, aiding in the optimization of reinforcement learning algorithms for complex environments and robotics Текстовый файл |
| Sprog: | russisk |
| Udgivet: |
2024
|
| Fag: | |
| Online adgang: | http://earchive.tpu.ru/handle/11683/80462 |
| Format: | Electronisk Book Chapter |
| KOHA link: | https://koha.lib.tpu.ru/cgi-bin/koha/opac-detail.pl?biblionumber=674286 |
MARC
| LEADER | 00000naa2a2200000 4500 | ||
|---|---|---|---|
| 001 | 674286 | ||
| 005 | 20241004142908.0 | ||
| 090 | |a 674286 | ||
| 100 | |a 20240829d2024 k||y0rusy50 ca | ||
| 101 | 0 | |a rus | |
| 102 | |a RU | ||
| 135 | |a drcn ---uucaa | ||
| 200 | 1 | |a Обучение агентов в виртуальной среде KukaDiversObjectEnv |d Training agents in a KukaDiversObjectEnv virtual environment |f Н. Е. Залогин |g науч. рук. Д. С. Григорьев ; Национальный исследовательский Томский политехнический университет |z eng | |
| 300 | |a Заглавие с экрана | ||
| 320 | |a Список литературы: 7 назв. | ||
| 330 | |a The present study implements and compares the DQN, PPO, Parallel PPO, and Modified PPO algorithms in the PyBullet KukaDiverseObjectEnv environment. The algorithms are tested and evaluated in a simulated test mode to assess their performance. The experiments focus on metrics such as learning speed, stability, and task completion success rate. The results provide insights into the effectiveness of each algorithm in the tested environment, aiding in the optimization of reinforcement learning algorithms for complex environments and robotics | ||
| 336 | |a Текстовый файл | ||
| 461 | 1 | |0 674010 |t Перспективы развития фундаментальных наук |l Prospects of Fundamental Sciences Development |o сборник научных трудов XXI Международной конференции студентов, аспирантов и молодых ученых, г. Томск, 23-26 апреля 2024 г. |9 674010 |a Курзина, И. А. (химик ; 1972-) |c Томск |n Изд-во ТПУ | |
| 463 | 1 | |0 674014 |t Т. 7 : IT-технологии и электроника |v С. 42-44 |d 2024 |9 674014 |p 1 файл (31,4 MB, 190 с.) |u conference_tpu-2024-C21_V7.pdf |l Vol. 7 : IT-technologies and Electronics | |
| 610 | 1 | |a труды учёных ТПУ | |
| 610 | 1 | |a электронный ресурс | |
| 610 | 1 | |a reinforcement learning | |
| 610 | 1 | |a robotic arm | |
| 610 | 1 | |a PyBullet | |
| 700 | 1 | |a Залогин |b Н. Е. | |
| 702 | 1 | |a Григорьев |b Д. С. |c специалист в области информатики и вычислительной техники |c ассистент Томского политехнического университета |f 1991- |g Дмитрий Сергеевич |4 727 | |
| 712 | 0 | 2 | |a Национальный исследовательский Томский политехнический университет |c (2009- ) |9 26305 |4 570 |
| 801 | 0 | |a RU |b 63413507 |c 20240829 |g RCR | |
| 856 | 4 | |z http://earchive.tpu.ru/handle/11683/80462 |u http://earchive.tpu.ru/handle/11683/80462 | |
| 942 | |c CF | ||