|
|
|
|
| LEADER |
00000nam0a2200000 4500 |
| 001 |
197305 |
| 005 |
20231101224739.0 |
| 010 |
|
|
|a 9785947743517
|
| 035 |
|
|
|a (RuTPU)RU\TPU\book\215211
|
| 090 |
|
|
|a 197305
|
| 100 |
|
|
|a 20110608d2011 k y0rusy50 ca
|
| 101 |
1 |
|
|a rus
|c eng
|
| 102 |
|
|
|a RU
|
| 105 |
|
|
|a a z 001zy
|
| 200 |
1 |
|
|a Обучение с подкреплением
|e пер. с англ.
|f Р. С. Саттон, Э. Г. Барто
|
| 210 |
|
|
|a Москва
|c БИНОМ. Лаборатория знаний
|d 2011
|
| 215 |
|
|
|a 400 с.
|c ил.
|
| 225 |
1 |
|
|a Адаптивные и интеллектуальные системы
|
| 320 |
|
|
|a Библиогр.: с. 359-379.
|
| 320 |
|
|
|a Предметный указатель: с. 380-395.
|
| 330 |
|
|
|a Обучение с подкреплением является одной из наиболее активно развивающихся областей, связанных с созданием искусственных интеллектуальных систем. Оно основано на том, что агент пытается максимизировать получаемый выигрыш, действуя в сложной среде с высоким уровнем неопределенности. Дается исчерпывающее и ясное изложение идей, методов и алгоритмов обучения с подкреплением, при этом диапазон излагаемого материала — от истоков возникновения рассматриваемых концепций до современных результатов в данной области. Для специалистов в области искусственного интеллекта, нейросетевого моделирования и управления, а также студентов и аспирантов соответствующих специальностей.
|
| 606 |
1 |
|
|a Искусственный интеллект
|2 stltpush
|3 (RuTPU)RU\TPU\subj\13185
|9 39836
|
| 610 |
1 |
|
|a обучение с подкреплением
|
| 610 |
1 |
|
|a история
|
| 610 |
1 |
|
|a элементы
|
| 610 |
1 |
|
|a оценочная обратная связь
|
| 610 |
1 |
|
|a марковские процессы
|
| 610 |
1 |
|
|a динамическое программирование
|
| 610 |
1 |
|
|a методы Монте-Карло
|
| 610 |
1 |
|
|a TD-методы
|
| 610 |
1 |
|
|a следы приемлемости
|
| 610 |
1 |
|
|a функции
|
| 610 |
1 |
|
|a обобщение
|
| 610 |
1 |
|
|a аппроксимация
|
| 610 |
1 |
|
|a планирование
|
| 610 |
1 |
|
|a конкретные примеры
|
| 675 |
|
|
|a 004.8
|v 4
|
| 700 |
|
1 |
|a Саттон
|b Р. С.
|g Ричард С.
|
| 701 |
|
1 |
|a Барто
|b Э. Г.
|g Эндрю Г.
|
| 801 |
|
1 |
|a RU
|b 63413507
|c 20110608
|
| 801 |
|
2 |
|a RU
|b 63413507
|c 20140516
|g RCR
|
| 900 |
|
|
|a Искусственный интеллект
|
| 900 |
|
|
|a Адаптивные системы управления
|
| 900 |
|
|
|a Интеллектуальные информационные системы
|
| 942 |
|
|
|c BK
|
| 959 |
|
|
|a 60/20110607
|d 1
|e 0,00
|f ЧЗТЛ:1
|