Моделирование искусственных нейронных сетей с помощью графического адаптера общего назначения; Известия Томского политехнического университета [Известия ТПУ]; Т. 325, № 5 : Информационные технологии

Detalhes bibliográficos
Parent link:Известия Томского политехнического университета [Известия ТПУ]/ Томский политехнический университет (ТПУ).— , 2000-
Т. 325, № 5 : Информационные технологии.— 2014.— [С. 72-76]
Autor principal: Королев А. А. Александр Аркадьевич
Autor Corporativo: Ижевский государственный технический университет
Outros Autores: Кучуганов А. В. Александр Валерьевич
Resumo:Заглавие с титульного листа
Электронная версия печатной публикации
Актуальность работы обусловлена тем, что искусственные нейронные сети, будучи наиболее успешным подходом к решению некоторых задач искусственного интеллекта, предъявляют высокие требования к вычислительным ресурсам. При этом в большинстве случаев именно высокая вычислительная нагрузка оказывается ограничивающим фактором, снижающим на практике функциональность и применимость аппарата искусственных нейронных сетей. Цель работы: повышение эффективности при решении задач искусственного интеллекта с применением искусственных нейронных сетей путём увеличения производительности моделирования за счёт применения высокопараллельных вычислений на графическом адаптере общего назначения. Методы исследования. Теоретические исследования выполнены с использованием теории параллельных вычислений, теории графов, векторной алгебры и методов системного анализа. В ходе экспериментальных исследовании осуществлена апробация программного комплекса системы анализа изображений с использованием предложенных подходов. Результаты. Предложен подход для моделирования нейронных сетей различных архитектур с высокой степенью параллелизма обработки, позволяющий перенести вычисления на графический адаптер общего назначения, заключающийся в группировке связей между нейронами по признаку их параллелизма по времени обработки. Такая группировка позволила заранее определить, какие вычислительные задачи могут выполняться параллельно и какие последовательно, что заметно упростило перенос вычислений на графический адаптер, а также позволило реализовать пакетную обработку, ускоряющую вычисления и на центральном процессоре. Достигнутый коэффициент ускорения обработки за счёт использования параллельных вычислений на графическом адаптере достигает коэффициента отношения его пиковой теоретической производительности к таковой характеристике центрального процессора, что говорит о высокой эффективности предложенного подхода.
The relevance of the discussed issue is caused by the high computational load generating by an artificial neural network simulation, while the latter is the most successful solution for several AI tasks. In most cases, the high computational load of artificial neural network simulation causes a decline of its functionality and restricts its applicability. The main aim of the study is to improve the efficiency of resolving the AI tasks using artificial neural networks by improving simulation performance applying parallel computations on general purpose graphics processing unit. The methods used in the study. The theoretical researches were carried out using concurrency theory, graph theory, vector algebra and methods of systems analysis. During the experimental study the authors tested an image analysis system software complex that uses the proposed approaches. The results. The authors proposed an approach to simulate the variety of artificial neural networks with high degree of parallelism, which is based on specific precomputation of the groups of compute-time parallel connections between neurons. This group defines explicitly what parts of overall computational task can be performed in parallel. The approach allows transferring as well a computational load to graphics processing unit and performing a batch processing on central processing unit. The achieved performance speed-up ratio reaches the ratio of GPU peak theoretical performance to that of CPU indicating the high efficiency of the proposed approach.
Idioma:russo
Publicado em: 2014
Assuntos:
Acesso em linha:http://earchive.tpu.ru/bitstream/11683/5385/1/bulletin_tpu-2014-325-5-09.pdf
Formato: Recurso Electrónico Capítulo de Livro
KOHA link:https://koha.lib.tpu.ru/cgi-bin/koha/opac-detail.pl?biblionumber=275886

MARC

LEADER 00000nla2a2200000 4500
001 275886
005 20231031230856.0
035 |a (RuTPU)RU\TPU\book\299139 
090 |a 275886 
100 |a 20141117d2014 k y0rusy50 ca 
101 0 |a rus 
102 |a RU 
135 |a drnn ---uucaa 
181 0 |a i  
182 0 |a b 
200 1 |a Моделирование искусственных нейронных сетей с помощью графического адаптера общего назначения  |b Электронный ресурс  |f А. А. Королев, А. В. Кучуганов 
203 |a Текст  |c электронный 
215 |a 1 файл (496 Kb) 
230 |a Электронные текстовые данные (1 файл : 496 Kb) 
300 |a Заглавие с титульного листа 
300 |a Электронная версия печатной публикации 
320 |a [Библиогр.: с. 75-76 (21 назв.)] 
330 |a Актуальность работы обусловлена тем, что искусственные нейронные сети, будучи наиболее успешным подходом к решению некоторых задач искусственного интеллекта, предъявляют высокие требования к вычислительным ресурсам. При этом в большинстве случаев именно высокая вычислительная нагрузка оказывается ограничивающим фактором, снижающим на практике функциональность и применимость аппарата искусственных нейронных сетей. Цель работы: повышение эффективности при решении задач искусственного интеллекта с применением искусственных нейронных сетей путём увеличения производительности моделирования за счёт применения высокопараллельных вычислений на графическом адаптере общего назначения. Методы исследования. Теоретические исследования выполнены с использованием теории параллельных вычислений, теории графов, векторной алгебры и методов системного анализа. В ходе экспериментальных исследовании осуществлена апробация программного комплекса системы анализа изображений с использованием предложенных подходов. Результаты. Предложен подход для моделирования нейронных сетей различных архитектур с высокой степенью параллелизма обработки, позволяющий перенести вычисления на графический адаптер общего назначения, заключающийся в группировке связей между нейронами по признаку их параллелизма по времени обработки. Такая группировка позволила заранее определить, какие вычислительные задачи могут выполняться параллельно и какие последовательно, что заметно упростило перенос вычислений на графический адаптер, а также позволило реализовать пакетную обработку, ускоряющую вычисления и на центральном процессоре. Достигнутый коэффициент ускорения обработки за счёт использования параллельных вычислений на графическом адаптере достигает коэффициента отношения его пиковой теоретической производительности к таковой характеристике центрального процессора, что говорит о высокой эффективности предложенного подхода. 
330 |a The relevance of the discussed issue is caused by the high computational load generating by an artificial neural network simulation, while the latter is the most successful solution for several AI tasks. In most cases, the high computational load of artificial neural network simulation causes a decline of its functionality and restricts its applicability. The main aim of the study is to improve the efficiency of resolving the AI tasks using artificial neural networks by improving simulation performance applying parallel computations on general purpose graphics processing unit. The methods used in the study. The theoretical researches were carried out using concurrency theory, graph theory, vector algebra and methods of systems analysis. During the experimental study the authors tested an image analysis system software complex that uses the proposed approaches. The results. The authors proposed an approach to simulate the variety of artificial neural networks with high degree of parallelism, which is based on specific precomputation of the groups of compute-time parallel connections between neurons. This group defines explicitly what parts of overall computational task can be performed in parallel. The approach allows transferring as well a computational load to graphics processing unit and performing a batch processing on central processing unit. The achieved performance speed-up ratio reaches the ratio of GPU peak theoretical performance to that of CPU indicating the high efficiency of the proposed approach. 
337 |a Adobe Reader 
453 |t Simulation of artificial neural networks using general purpose graphics processing unit  |o translation from Russian  |f A. A. Korolev, A. V. Kuchuganov  |c Tomsk  |n TPU Press  |d 2014  |d 2014  |a Korolev, Alexander 
453 |t Bulletin of the Tomsk Polytechnic University 
453 |t Vol. 325, № 5 : IT Technologies 
461 1 |0 (RuTPU)RU\TPU\book\176237  |t Известия Томского политехнического университета [Известия ТПУ]  |f Томский политехнический университет (ТПУ)  |d 2000- 
463 1 |0 (RuTPU)RU\TPU\book\298625  |x 1684-8519  |t Т. 325, № 5 : Информационные технологии  |v [С. 72-76]  |d 2014 
610 1 |a электронный ресурс 
610 1 |a искусственные нейронные сети 
610 1 |a массовый параллелизм 
610 1 |a графические адаптеры общего назначения 
610 1 |a CUDA 
610 1 |a распознавание 
610 1 |a образы 
610 |a artificial neural networks 
610 |a massive parallelism 
610 |a general purpose graphics processing unit 
610 |a CUDA 
610 |a image recognition 
700 1 |a Королев  |b А. А.  |g Александр Аркадьевич  |6 z01712 
701 1 |a Кучуганов  |b А. В.  |g Александр Валерьевич  |6 z02712 
712 0 2 |a Ижевский государственный технический университет  |f z01700  |2 stltpush  |3 (RuTPU)RU\TPU\col\5643 
712 0 2 |a Ижевский государственный технический университет  |f z02701  |2 stltpush  |3 (RuTPU)RU\TPU\col\5643 
801 2 |a RU  |b 63413507  |c 20190517  |g PSBO 
856 4 |u http://earchive.tpu.ru/bitstream/11683/5385/1/bulletin_tpu-2014-325-5-09.pdf 
942 |c CF