Применение вероятностного алгоритма соединения записей для исключения дублирования информации в корпоративной базе данных; Известия Томского политехнического университета [Известия ТПУ]; Т. 309, № 7

Bibliographische Detailangaben
Parent link:	Известия Томского политехнического университета [Известия ТПУ]/ Томский политехнический университет (ТПУ).— , 2000- Т. 309, № 7.— 2006.— [С. 111-116]
1. Verfasser:	Пинжин А. Е. Алексей Евгеньевич
Zusammenfassung:	Заглавие с титульного листа Электронная версия печатной публикации Рассмотрена возможность применения вероятностного алгоритма соединения записей для устранения дублирования информации в базе данных крупной организации или предприятия. Отражены теоретические основы алгоритма, предложены способы оценки степени сходства по основным типам атрибутов, рассмотрены возможности усовершенствования модели путем учета степени достоверности данных, поступающих из разных источников. Приведены практические результаты работы на примере задачи устранения дубликатов записей о физических лицах в единой базе данных российского вуза.
Sprache:	Russisch
Veröffentlicht:	2006
Schriftenreihe:	Технические науки
Schlagworte:	вероятностный алгоритм записи дублирование информация корпоративные базы данных крупные организации крупные предприятия теоретические основы оценка сходства атрибуты данные источники практические результаты дубликаты физические лица российские вузы труды учёных ТПУ электронный ресурс
Online-Zugang:	http://www.lib.tpu.ru/fulltext/v/Bulletin_TPU/2006/v309/i7/24.pdf
Format:	Elektronisch Buchkapitel
KOHA link:	https://koha.lib.tpu.ru/cgi-bin/koha/opac-detail.pl?biblionumber=171790

Beschreibung
Beschreibung:	1 файл (365 Кб)
Zusammenfassung:	Заглавие с титульного листа Электронная версия печатной публикации Рассмотрена возможность применения вероятностного алгоритма соединения записей для устранения дублирования информации в базе данных крупной организации или предприятия. Отражены теоретические основы алгоритма, предложены способы оценки степени сходства по основным типам атрибутов, рассмотрены возможности усовершенствования модели путем учета степени достоверности данных, поступающих из разных источников. Приведены практические результаты работы на примере задачи устранения дубликатов записей о физических лицах в единой базе данных российского вуза.

Ähnliche Einträge