Применение вейвлет-преобразования Хаара, метода главных компонент и нейронных сетей для оптического распознавания символов на изображениях в присутствии импульсного шума

Bibliographic Details
Parent link:Компьютерная оптика: научный журнал/ Институт систем обработки изображений Российской академии наук.— , 1987-
Т. 40, № 2.— 2016.— [С. 249-257]
Corporate Author: Национальный исследовательский Томский политехнический университет Институт кибернетики Кафедра вычислительной техники
Other Authors: Спицын В. Г. Владимир Григорьевич, Болотова Ю. А. Юлия Александровна, Фан Нгок Хоанг, Буй Тхи Тху Чанг
Summary:Заглавие с экрана
В работе предложен новый алгоритм распознавания символов в условиях импульсного шума на основе применения вейвлет-преобразования, метода главных компонент и нейронных сетей. В предлагаемом алгоритме для устранения шума и извлечения признаков из исходного изображения и его отдельных частей с помощью вейвлет-преобразования Хаара выделяются низкочастотные компоненты. Сокращение размерности извлечённых признаков осуществляется методом главных компонент. В качестве классификатора используется многослойная нейронная сеть, на входы которой подаётся сокращённый набор признаков. Одной из ключевых особенностей предлагаемого подхода является создание отдельной нейронной сети для каждого типа символа. Результаты экспериментов показывают, что разработанный алгоритм сравним по точности распознавания с системами ABBYY FineReader и Tesseract в условиях импульсного шума.
In this paper we propose a novel algorithm for optical character recognition in the presence of impulse noise by applying a wavelet transform, principal component analysis, and neural networks. In the proposed algorithm, the Haar wavelet transform is used for low frequency components allocation, noise elimination and feature extraction. The principal component analysis is used to reduce the dimension of the extracted features. We use a set of different multi-layer neural networks as classifiers for each character; the inputs are represented by a reduced set of features. One of the key features of the proposed approach is creating a separate neural network for each type of character. The experimental results show that the proposed algorithm can effectively recognize the characters in images in the presence of impulse noise; the results are comparable with ABBYY FineReader and Tesseract OCR.
Режим доступа: по договору с организацией-держателем ресурса
Published: 2016
Series:Обработка изображений, распознавание образов
Subjects:
Online Access:http://elibrary.ru/item.asp?id=25995058
http://www.computeroptics.smr.ru/KO/PDF/KO40-2/400216.pdf
Format: Electronic Book Chapter
KOHA link:https://koha.lib.tpu.ru/cgi-bin/koha/opac-detail.pl?biblionumber=648685