Оценка использования инструментов библиотеки SpaCy и DeepPavlov для задачи извлечения именованных сущностей из описаний результатов осмотров пациентов с COVID-19; Известия Томского политехнического университета [Известия ТПУ]. Промышленная кибернетика; Т. 1, № 2
| Parent link: | Известия Томского политехнического университета [Известия ТПУ]. Промышленная кибернетика: рецензируемый научный журнал/ Национальный исследовательский Томский политехнический университет.— .— Томск: ТПУ, 2023-.— 2949-5407 Т. 1, № 2.— 2023.— С. 46-53 |
|---|---|
| Altres autors: | , , , |
| Sumari: | Актуальность. Определяется необходимостью выделения значимых признаков из электронных медицинских записей для автоматизации оценки состояния больных. Цель. Оценка возможности выявления именованных сущностей в электронных описаниях осмотров пациентов с COVID-19 с помощью модели BERT из библиотек SpaCy и DeepPavlov. Методы. Глубокое обучение, статистические методы. Результаты и выводы. Выполнено исследование настройки нейросетевых моделей BERT из библиотек SpaCy и DeepPavlov для аннотирования документов «Осмотр пациентов лечащим врачом» с целью выделения следующих предикторов оценки состояния пациентов: температура, артериальное давление, частота дыхательных движений, частота сердечных сокращений и сатурация. Настройка и оценка эффективности архитектур производилась на основе разметки 340 обезличенных электронных медицинских записей пациентов, болевших COVID-19, полученных с помощью сервиса SibMED Data Clinical Repository. Показано, что настройка моделей на количестве около 150 размеченных документов позволяет определять указанные предикторы в таких текстах с точностью (Precision) 85–98 % и с полнотой (Recall) 77–98 % в зависимости от предиктора. Метрики качества работы архитектур из выбранных библиотек различались незначительно. Отмечено, что итеративное расширение обучающей выборки в результате эксплуатации моделей с последующей донастройкой приводит к повышению результативности моделей Relevance.Determined by the need to extract significant features from electronic medical records to automate the assessment of patients' condi-tion.Aim. Assessing the possibility of identifying named entitie in electronic descriptions of examinations of patients with COVID-19 using the BERT model from the SpaCyand DeepPavlov libraries.Methods.Deep learning, statistical methods. Results and conclusions. The authors havecar-ried out a fine-tuning study on BERT neural network models from the SpaCy and DeepPavlov libraries to annotate documents “Examination of pa-tients by the attending physician” in order to highlight the following predictors of patient assessment: temperature, blood pressure, respiratory rate, heart rate and saturation. Configuration and evaluation of the effectiveness of the architectures was carried out based on the markup of 340 anon-ymized electronic medical records of patients with COVID-19, obtained using the SibMED Data Clinical Repository service. It is shown that setting up models on a number of about 150 labeled documents makes it possible to determine the specified predictors in such texts with accuracy (Preci-sion) of 85–98% and completeness (Recall) of 77–98%, depending on the predictor. The quality metrics of the architectures from the selected li-braries differed slightly. Iterative expansion of the training set as a result of the operation of models with subsequent additional tuning leads to an increase in the effectiveness of the models Текстовый файл |
| Idioma: | rus |
| Publicat: |
2023
|
| Matèries: | |
| Accés en línia: | http://earchive.tpu.ru/handle/11683/81892 https://doi.org/10.18799/29495407/2023/2/27 |
| Format: | Electrònic Capítol de llibre |
| KOHA link: | https://koha.lib.tpu.ru/cgi-bin/koha/opac-detail.pl?biblionumber=675387 |
MARC
| LEADER | 00000naa2a2200000 4500 | ||
|---|---|---|---|
| 001 | 675387 | ||
| 005 | 20241209132803.0 | ||
| 090 | |a 675387 | ||
| 100 | |a 20241010d2023 k||y0rusy50 ca | ||
| 101 | 0 | |a rus | |
| 102 | |a RU | ||
| 135 | |a drcn ---uucaa | ||
| 200 | 1 | |a Оценка использования инструментов библиотеки SpaCy и DeepPavlov для задачи извлечения именованных сущностей из описаний результатов осмотров пациентов с COVID-19 |d Evaluation of SpaCy and DeepPavlov library tools for named entities recognition from descriptions ofexamination resultsof patients with COVID-19 |z eng |f Д. Е. Соколовский, В. Н. Некрасов, С. А. Землянский, С. В. Аксёнов | |
| 320 | |a Список литературы: с. 51 (18 назв.) | ||
| 330 | |a Актуальность. Определяется необходимостью выделения значимых признаков из электронных медицинских записей для автоматизации оценки состояния больных. Цель. Оценка возможности выявления именованных сущностей в электронных описаниях осмотров пациентов с COVID-19 с помощью модели BERT из библиотек SpaCy и DeepPavlov. Методы. Глубокое обучение, статистические методы. Результаты и выводы. Выполнено исследование настройки нейросетевых моделей BERT из библиотек SpaCy и DeepPavlov для аннотирования документов «Осмотр пациентов лечащим врачом» с целью выделения следующих предикторов оценки состояния пациентов: температура, артериальное давление, частота дыхательных движений, частота сердечных сокращений и сатурация. Настройка и оценка эффективности архитектур производилась на основе разметки 340 обезличенных электронных медицинских записей пациентов, болевших COVID-19, полученных с помощью сервиса SibMED Data Clinical Repository. Показано, что настройка моделей на количестве около 150 размеченных документов позволяет определять указанные предикторы в таких текстах с точностью (Precision) 85–98 % и с полнотой (Recall) 77–98 % в зависимости от предиктора. Метрики качества работы архитектур из выбранных библиотек различались незначительно. Отмечено, что итеративное расширение обучающей выборки в результате эксплуатации моделей с последующей донастройкой приводит к повышению результативности моделей | ||
| 330 | |a Relevance.Determined by the need to extract significant features from electronic medical records to automate the assessment of patients' condi-tion.Aim. Assessing the possibility of identifying named entitie in electronic descriptions of examinations of patients with COVID-19 using the BERT model from the SpaCyand DeepPavlov libraries.Methods.Deep learning, statistical methods. Results and conclusions. The authors havecar-ried out a fine-tuning study on BERT neural network models from the SpaCy and DeepPavlov libraries to annotate documents “Examination of pa-tients by the attending physician” in order to highlight the following predictors of patient assessment: temperature, blood pressure, respiratory rate, heart rate and saturation. Configuration and evaluation of the effectiveness of the architectures was carried out based on the markup of 340 anon-ymized electronic medical records of patients with COVID-19, obtained using the SibMED Data Clinical Repository service. It is shown that setting up models on a number of about 150 labeled documents makes it possible to determine the specified predictors in such texts with accuracy (Preci-sion) of 85–98% and completeness (Recall) of 77–98%, depending on the predictor. The quality metrics of the architectures from the selected li-braries differed slightly. Iterative expansion of the training set as a result of the operation of models with subsequent additional tuning leads to an increase in the effectiveness of the models | ||
| 336 | |a Текстовый файл | ||
| 461 | 1 | |0 672190 |9 672190 |t Известия Томского политехнического университета [Известия ТПУ]. Промышленная кибернетика |o рецензируемый научный журнал |f Национальный исследовательский Томский политехнический университет |c Томск |n ТПУ |d 2023- |x 2949-5407 | |
| 463 | 1 | |0 675304 |9 675304 |t Т. 1, № 2 |d 2023 |v С. 46-53 | |
| 610 | 1 | |a электронный ресурс | |
| 610 | 1 | |a труды учёных ТПУ | |
| 610 | 1 | |a глубокое обучение | |
| 610 | 1 | |a извлечение именованных сущностей | |
| 610 | 1 | |a BERT | |
| 610 | 1 | |a SpaСy | |
| 610 | 1 | |a DeepPavlov | |
| 610 | 1 | |a Deep learning | |
| 610 | 1 | |a named entity extraction | |
| 701 | 1 | |a Соколовский |b Д. Е. |g Дмитрий Евгеньевич | |
| 701 | 1 | |a Некрасов |b В. Н. |g Владимир Николаевич | |
| 701 | 1 | |a Землянский |b С. А. |g Сергей Александрович | |
| 701 | 1 | |a Аксёнов |b С. В. |c специалист в области информатики и вычислительной техники |c доцент Томского политехнического университета, кандидат технических наук |f 1983- |g Сергей Владимирович |9 11326 | |
| 801 | 0 | |a RU |b 63413507 |c 20241010 | |
| 850 | |a 63413507 | ||
| 856 | 4 | |u http://earchive.tpu.ru/handle/11683/81892 |z http://earchive.tpu.ru/handle/11683/81892 | |
| 856 | 4 | |u https://doi.org/10.18799/29495407/2023/2/27 |z https://doi.org/10.18799/29495407/2023/2/27 | |
| 942 | |c CF | ||