Автоматическая генерация коротких текстов на основе применения нейронных сетей LSTM и SeqGAN

Podrobná bibliografie
Parent link:Вестник Томского государственного университета. Управление, вычислительная техника и информатика.— , 2011-
№ 57.— 2021.— [С. 118-130]
Hlavní autor: Кривошеев Н. А. Николай Анатольевич
Korporativní autor: Национальный исследовательский Томский политехнический университет Инженерная школа информационных технологий и робототехники Отделение информационных технологий
Další autoři: Иванова Ю. А. Юлия Александровна, Спицын В. Г. Владимир Григорьевич
Shrnutí:Заглавие с экрана
Проведено исследование качества генерации коротких текстов на основе применения нейронных сетей LSTM и SeqGAN на русском и английском языках. Для обучения нейронной сети используются следующие подходы: оценка максимального правдоподобия и состязательная сеть, генерирующая последовательность (Sequence Generative Adversarial Nets, SeqGAN). В данной работе реализация SeqGAN не включает алгоритм Монте-Карло. Предложен и реализован подход на основе возведения значений выходного вектора нейронной сети (вектора вероятностей) в степень, большую 1, данная операция позволяет увеличить качество генерируемого текста, но снижает его разнообразие. Обучение и тестирование проводятся на основе следующих выборок данных: сборника русских стихов с сайта Stihi.ru и подписей к изображениям на английском языке из выборки COCO Image Captions. Проведена оценка качества генерации текстов на основе метрики BLEU. Приведены примеры сгенерированных текстов. Проанализированы аналогичные решения.
Режим доступа: по договору с организацией-держателем ресурса
Jazyk:ruština
Vydáno: 2021
Témata:
On-line přístup:https://www.elibrary.ru/item.asp?id=48008269
https://doi.org/10.17223/19988605/57/13
Médium: Elektronický zdroj Kapitola
KOHA link:https://koha.lib.tpu.ru/cgi-bin/koha/opac-detail.pl?biblionumber=667041
Popis
Shrnutí:Заглавие с экрана
Проведено исследование качества генерации коротких текстов на основе применения нейронных сетей LSTM и SeqGAN на русском и английском языках. Для обучения нейронной сети используются следующие подходы: оценка максимального правдоподобия и состязательная сеть, генерирующая последовательность (Sequence Generative Adversarial Nets, SeqGAN). В данной работе реализация SeqGAN не включает алгоритм Монте-Карло. Предложен и реализован подход на основе возведения значений выходного вектора нейронной сети (вектора вероятностей) в степень, большую 1, данная операция позволяет увеличить качество генерируемого текста, но снижает его разнообразие. Обучение и тестирование проводятся на основе следующих выборок данных: сборника русских стихов с сайта Stihi.ru и подписей к изображениям на английском языке из выборки COCO Image Captions. Проведена оценка качества генерации текстов на основе метрики BLEU. Приведены примеры сгенерированных текстов. Проанализированы аналогичные решения.
Режим доступа: по договору с организацией-держателем ресурса
DOI:10.17223/19988605/57/13