Оценка использования инструментов библиотеки SpaCy и DeepPavlov для задачи извлечения именованных сущностей из описаний результатов осмотров пациентов с COVID-19; Известия Томского политехнического университета [Известия ТПУ]. Промышленная кибернетика; Т. 1, № 2

Dades bibliogràfiques
Parent link:Известия Томского политехнического университета [Известия ТПУ]. Промышленная кибернетика: рецензируемый научный журнал/ Национальный исследовательский Томский политехнический университет.— .— Томск: ТПУ, 2023-.— 2949-5407
Т. 1, № 2.— 2023.— С. 46-53
Altres autors: Соколовский Д. Е. Дмитрий Евгеньевич, Некрасов В. Н. Владимир Николаевич, Землянский С. А. Сергей Александрович, Аксёнов С. В. Сергей Владимирович
Sumari:Актуальность. Определяется необходимостью выделения значимых признаков из электронных медицинских записей для автоматизации оценки состояния больных. Цель. Оценка возможности выявления именованных сущностей в электронных описаниях осмотров пациентов с COVID-19 с помощью модели BERT из библиотек SpaCy и DeepPavlov. Методы. Глубокое обучение, статистические методы. Результаты и выводы. Выполнено исследование настройки нейросетевых моделей BERT из библиотек SpaCy и DeepPavlov для аннотирования документов «Осмотр пациентов лечащим врачом» с целью выделения следующих предикторов оценки состояния пациентов: температура, артериальное давление, частота дыхательных движений, частота сердечных сокращений и сатурация. Настройка и оценка эффективности архитектур производилась на основе разметки 340 обезличенных электронных медицинских записей пациентов, болевших COVID-19, полученных с помощью сервиса SibMED Data Clinical Repository. Показано, что настройка моделей на количестве около 150 размеченных документов позволяет определять указанные предикторы в таких текстах с точностью (Precision) 85–98 % и с полнотой (Recall) 77–98 % в зависимости от предиктора. Метрики качества работы архитектур из выбранных библиотек различались незначительно. Отмечено, что итеративное расширение обучающей выборки в результате эксплуатации моделей с последующей донастройкой приводит к повышению результативности моделей
Relevance.Determined by the need to extract significant features from electronic medical records to automate the assessment of patients' condi-tion.Aim. Assessing the possibility of identifying named entitie in electronic descriptions of examinations of patients with COVID-19 using the BERT model from the SpaCyand DeepPavlov libraries.Methods.Deep learning, statistical methods. Results and conclusions. The authors havecar-ried out a fine-tuning study on BERT neural network models from the SpaCy and DeepPavlov libraries to annotate documents “Examination of pa-tients by the attending physician” in order to highlight the following predictors of patient assessment: temperature, blood pressure, respiratory rate, heart rate and saturation. Configuration and evaluation of the effectiveness of the architectures was carried out based on the markup of 340 anon-ymized electronic medical records of patients with COVID-19, obtained using the SibMED Data Clinical Repository service. It is shown that setting up models on a number of about 150 labeled documents makes it possible to determine the specified predictors in such texts with accuracy (Preci-sion) of 85–98% and completeness (Recall) of 77–98%, depending on the predictor. The quality metrics of the architectures from the selected li-braries differed slightly. Iterative expansion of the training set as a result of the operation of models with subsequent additional tuning leads to an increase in the effectiveness of the models
Текстовый файл
Idioma:rus
Publicat: 2023
Matèries:
Accés en línia:http://earchive.tpu.ru/handle/11683/81892
https://doi.org/10.18799/29495407/2023/2/27
Format: Electrònic Capítol de llibre
KOHA link:https://koha.lib.tpu.ru/cgi-bin/koha/opac-detail.pl?biblionumber=675387

MARC

LEADER 00000naa2a2200000 4500
001 675387
005 20241209132803.0
090 |a 675387 
100 |a 20241010d2023 k||y0rusy50 ca 
101 0 |a rus 
102 |a RU 
135 |a drcn ---uucaa 
200 1 |a Оценка использования инструментов библиотеки SpaCy и DeepPavlov для задачи извлечения именованных сущностей из описаний результатов осмотров пациентов с COVID-19  |d Evaluation of SpaCy and DeepPavlov library tools for named entities recognition from descriptions ofexamination resultsof patients with COVID-19  |z eng  |f Д. Е. Соколовский, В. Н. Некрасов, С. А. Землянский, С. В. Аксёнов 
320 |a Список литературы: с. 51 (18 назв.) 
330 |a Актуальность. Определяется необходимостью выделения значимых признаков из электронных медицинских записей для автоматизации оценки состояния больных. Цель. Оценка возможности выявления именованных сущностей в электронных описаниях осмотров пациентов с COVID-19 с помощью модели BERT из библиотек SpaCy и DeepPavlov. Методы. Глубокое обучение, статистические методы. Результаты и выводы. Выполнено исследование настройки нейросетевых моделей BERT из библиотек SpaCy и DeepPavlov для аннотирования документов «Осмотр пациентов лечащим врачом» с целью выделения следующих предикторов оценки состояния пациентов: температура, артериальное давление, частота дыхательных движений, частота сердечных сокращений и сатурация. Настройка и оценка эффективности архитектур производилась на основе разметки 340 обезличенных электронных медицинских записей пациентов, болевших COVID-19, полученных с помощью сервиса SibMED Data Clinical Repository. Показано, что настройка моделей на количестве около 150 размеченных документов позволяет определять указанные предикторы в таких текстах с точностью (Precision) 85–98 % и с полнотой (Recall) 77–98 % в зависимости от предиктора. Метрики качества работы архитектур из выбранных библиотек различались незначительно. Отмечено, что итеративное расширение обучающей выборки в результате эксплуатации моделей с последующей донастройкой приводит к повышению результативности моделей 
330 |a Relevance.Determined by the need to extract significant features from electronic medical records to automate the assessment of patients' condi-tion.Aim. Assessing the possibility of identifying named entitie in electronic descriptions of examinations of patients with COVID-19 using the BERT model from the SpaCyand DeepPavlov libraries.Methods.Deep learning, statistical methods. Results and conclusions. The authors havecar-ried out a fine-tuning study on BERT neural network models from the SpaCy and DeepPavlov libraries to annotate documents “Examination of pa-tients by the attending physician” in order to highlight the following predictors of patient assessment: temperature, blood pressure, respiratory rate, heart rate and saturation. Configuration and evaluation of the effectiveness of the architectures was carried out based on the markup of 340 anon-ymized electronic medical records of patients with COVID-19, obtained using the SibMED Data Clinical Repository service. It is shown that setting up models on a number of about 150 labeled documents makes it possible to determine the specified predictors in such texts with accuracy (Preci-sion) of 85–98% and completeness (Recall) of 77–98%, depending on the predictor. The quality metrics of the architectures from the selected li-braries differed slightly. Iterative expansion of the training set as a result of the operation of models with subsequent additional tuning leads to an increase in the effectiveness of the models 
336 |a Текстовый файл 
461 1 |0 672190  |9 672190  |t Известия Томского политехнического университета [Известия ТПУ]. Промышленная кибернетика  |o рецензируемый научный журнал  |f Национальный исследовательский Томский политехнический университет  |c Томск  |n ТПУ  |d 2023-  |x 2949-5407 
463 1 |0 675304  |9 675304  |t Т. 1, № 2  |d 2023  |v С. 46-53 
610 1 |a электронный ресурс 
610 1 |a труды учёных ТПУ 
610 1 |a глубокое обучение 
610 1 |a извлечение именованных сущностей 
610 1 |a BERT 
610 1 |a SpaСy 
610 1 |a DeepPavlov 
610 1 |a Deep learning 
610 1 |a named entity extraction 
701 1 |a Соколовский  |b Д. Е.  |g Дмитрий Евгеньевич 
701 1 |a Некрасов  |b В. Н.  |g Владимир Николаевич 
701 1 |a Землянский  |b С. А.  |g Сергей Александрович 
701 1 |a Аксёнов  |b С. В.  |c специалист в области информатики и вычислительной техники  |c доцент Томского политехнического университета, кандидат технических наук  |f 1983-  |g Сергей Владимирович  |9 11326 
801 0 |a RU  |b 63413507  |c 20241010 
850 |a 63413507 
856 4 |u http://earchive.tpu.ru/handle/11683/81892  |z http://earchive.tpu.ru/handle/11683/81892 
856 4 |u https://doi.org/10.18799/29495407/2023/2/27  |z https://doi.org/10.18799/29495407/2023/2/27 
942 |c CF