Оценка использования инструментов библиотеки SpaCy и DeepPavlov для задачи извлечения именованных сущностей из описаний результатов осмотров пациентов с COVID-19; Известия Томского политехнического университета [Известия ТПУ]. Промышленная кибернетика; Т. 1, № 2

Dades bibliogràfiques
Parent link:	Известия Томского политехнического университета [Известия ТПУ]. Промышленная кибернетика: рецензируемый научный журнал/ Национальный исследовательский Томский политехнический университет.— .— Томск: ТПУ, 2023-.— 2949-5407 Т. 1, № 2.— 2023.— С. 46-53
Altres autors:	Соколовский Д. Е. Дмитрий Евгеньевич, Некрасов В. Н. Владимир Николаевич, Землянский С. А. Сергей Александрович, Аксёнов С. В. Сергей Владимирович
Sumari:	Актуальность. Определяется необходимостью выделения значимых признаков из электронных медицинских записей для автоматизации оценки состояния больных. Цель. Оценка возможности выявления именованных сущностей в электронных описаниях осмотров пациентов с COVID-19 с помощью модели BERT из библиотек SpaCy и DeepPavlov. Методы. Глубокое обучение, статистические методы. Результаты и выводы. Выполнено исследование настройки нейросетевых моделей BERT из библиотек SpaCy и DeepPavlov для аннотирования документов «Осмотр пациентов лечащим врачом» с целью выделения следующих предикторов оценки состояния пациентов: температура, артериальное давление, частота дыхательных движений, частота сердечных сокращений и сатурация. Настройка и оценка эффективности архитектур производилась на основе разметки 340 обезличенных электронных медицинских записей пациентов, болевших COVID-19, полученных с помощью сервиса SibMED Data Clinical Repository. Показано, что настройка моделей на количестве около 150 размеченных документов позволяет определять указанные предикторы в таких текстах с точностью (Precision) 85–98 % и с полнотой (Recall) 77–98 % в зависимости от предиктора. Метрики качества работы архитектур из выбранных библиотек различались незначительно. Отмечено, что итеративное расширение обучающей выборки в результате эксплуатации моделей с последующей донастройкой приводит к повышению результативности моделей Relevance.Determined by the need to extract significant features from electronic medical records to automate the assessment of patients' condi-tion.Aim. Assessing the possibility of identifying named entitie in electronic descriptions of examinations of patients with COVID-19 using the BERT model from the SpaCyand DeepPavlov libraries.Methods.Deep learning, statistical methods. Results and conclusions. The authors havecar-ried out a fine-tuning study on BERT neural network models from the SpaCy and DeepPavlov libraries to annotate documents “Examination of pa-tients by the attending physician” in order to highlight the following predictors of patient assessment: temperature, blood pressure, respiratory rate, heart rate and saturation. Configuration and evaluation of the effectiveness of the architectures was carried out based on the markup of 340 anon-ymized electronic medical records of patients with COVID-19, obtained using the SibMED Data Clinical Repository service. It is shown that setting up models on a number of about 150 labeled documents makes it possible to determine the specified predictors in such texts with accuracy (Preci-sion) of 85–98% and completeness (Recall) of 77–98%, depending on the predictor. The quality metrics of the architectures from the selected li-braries differed slightly. Iterative expansion of the training set as a result of the operation of models with subsequent additional tuning leads to an increase in the effectiveness of the models Текстовый файл
Idioma:	rus
Publicat:	2023
Matèries:	электронный ресурс труды учёных ТПУ глубокое обучение извлечение именованных сущностей BERT SpaСy DeepPavlov Deep learning named entity extraction
Accés en línia:	http://earchive.tpu.ru/handle/11683/81892 https://doi.org/10.18799/29495407/2023/2/27
Format:	Electrònic Capítol de llibre
KOHA link:	https://koha.lib.tpu.ru/cgi-bin/koha/opac-detail.pl?biblionumber=675387

MARC


LEADER	00000naa2a2200000 4500
001	675387
005	20241209132803.0
090			\|a 675387
100			\|a 20241010d2023 k\|\|y0rusy50 ca
101	0		\|a rus
102			\|a RU
135			\|a drcn ---uucaa
200	1		\|a Оценка использования инструментов библиотеки SpaCy и DeepPavlov для задачи извлечения именованных сущностей из описаний результатов осмотров пациентов с COVID-19 \|d Evaluation of SpaCy and DeepPavlov library tools for named entities recognition from descriptions ofexamination resultsof patients with COVID-19 \|z eng \|f Д. Е. Соколовский, В. Н. Некрасов, С. А. Землянский, С. В. Аксёнов
320			\|a Список литературы: с. 51 (18 назв.)
330			\|a Актуальность. Определяется необходимостью выделения значимых признаков из электронных медицинских записей для автоматизации оценки состояния больных. Цель. Оценка возможности выявления именованных сущностей в электронных описаниях осмотров пациентов с COVID-19 с помощью модели BERT из библиотек SpaCy и DeepPavlov. Методы. Глубокое обучение, статистические методы. Результаты и выводы. Выполнено исследование настройки нейросетевых моделей BERT из библиотек SpaCy и DeepPavlov для аннотирования документов «Осмотр пациентов лечащим врачом» с целью выделения следующих предикторов оценки состояния пациентов: температура, артериальное давление, частота дыхательных движений, частота сердечных сокращений и сатурация. Настройка и оценка эффективности архитектур производилась на основе разметки 340 обезличенных электронных медицинских записей пациентов, болевших COVID-19, полученных с помощью сервиса SibMED Data Clinical Repository. Показано, что настройка моделей на количестве около 150 размеченных документов позволяет определять указанные предикторы в таких текстах с точностью (Precision) 85–98 % и с полнотой (Recall) 77–98 % в зависимости от предиктора. Метрики качества работы архитектур из выбранных библиотек различались незначительно. Отмечено, что итеративное расширение обучающей выборки в результате эксплуатации моделей с последующей донастройкой приводит к повышению результативности моделей
330			\|a Relevance.Determined by the need to extract significant features from electronic medical records to automate the assessment of patients' condi-tion.Aim. Assessing the possibility of identifying named entitie in electronic descriptions of examinations of patients with COVID-19 using the BERT model from the SpaCyand DeepPavlov libraries.Methods.Deep learning, statistical methods. Results and conclusions. The authors havecar-ried out a fine-tuning study on BERT neural network models from the SpaCy and DeepPavlov libraries to annotate documents “Examination of pa-tients by the attending physician” in order to highlight the following predictors of patient assessment: temperature, blood pressure, respiratory rate, heart rate and saturation. Configuration and evaluation of the effectiveness of the architectures was carried out based on the markup of 340 anon-ymized electronic medical records of patients with COVID-19, obtained using the SibMED Data Clinical Repository service. It is shown that setting up models on a number of about 150 labeled documents makes it possible to determine the specified predictors in such texts with accuracy (Preci-sion) of 85–98% and completeness (Recall) of 77–98%, depending on the predictor. The quality metrics of the architectures from the selected li-braries differed slightly. Iterative expansion of the training set as a result of the operation of models with subsequent additional tuning leads to an increase in the effectiveness of the models
336			\|a Текстовый файл
461		1	\|0 672190 \|9 672190 \|t Известия Томского политехнического университета [Известия ТПУ]. Промышленная кибернетика \|o рецензируемый научный журнал \|f Национальный исследовательский Томский политехнический университет \|c Томск \|n ТПУ \|d 2023- \|x 2949-5407
463		1	\|0 675304 \|9 675304 \|t Т. 1, № 2 \|d 2023 \|v С. 46-53
610	1		\|a электронный ресурс
610	1		\|a труды учёных ТПУ
610	1		\|a глубокое обучение
610	1		\|a извлечение именованных сущностей
610	1		\|a BERT
610	1		\|a SpaСy
610	1		\|a DeepPavlov
610	1		\|a Deep learning
610	1		\|a named entity extraction
701		1	\|a Соколовский \|b Д. Е. \|g Дмитрий Евгеньевич
701		1	\|a Некрасов \|b В. Н. \|g Владимир Николаевич
701		1	\|a Землянский \|b С. А. \|g Сергей Александрович
701		1	\|a Аксёнов \|b С. В. \|c специалист в области информатики и вычислительной техники \|c доцент Томского политехнического университета, кандидат технических наук \|f 1983- \|g Сергей Владимирович \|9 11326
801		0	\|a RU \|b 63413507 \|c 20241010
850			\|a 63413507
856	4		\|u http://earchive.tpu.ru/handle/11683/81892 \|z http://earchive.tpu.ru/handle/11683/81892
856	4		\|u https://doi.org/10.18799/29495407/2023/2/27 \|z https://doi.org/10.18799/29495407/2023/2/27
942			\|c CF

MARC

Ítems similars