Scientific journal
Modern problems of science and education
ISSN 2070-7428
"Перечень" ВАК
ИФ РИНЦ = 1,006

COMPUTER DIAGNOSTICS OF PATHOLOGICAL CONDITIONS IN CHILDREN ASSOCIATED WITH CONNECTIVE TISSUE DYSPLASIA

Metalnikov A.I. 1 Kolokoltsev M.M. 2 Kazymov M.S. 3 Dubovaya A.V. 4 Duruda N.V. 1 Kudeyarova T.V. 1 Myadelets D.N. 1 Romanova E.V. 5
1 Altay state medical university
2 Irkutsk National Research Technical University
3 Non-profit joint-stock company "Medical University of Semey
4 Donetsk State Medical University named after M. Gorky
5 Altai state university
Purpose: to develop and implement a web application into the practical activities of a primary care physician that will reduce the time of patient examination and increase the accuracy of diagnosis of diseases associated with connective tissue dysplasia. A set of monitoring material for 254 children aged 5-6 years with dysplastic pathological manifestations was used. At the first stage, preliminary data processing (cleaning, standardization) was carried out. Among the methods of machine learning for primary care physicians, the following were selected and tested: logistic regression, linear discriminant analysis, decision tree, random forest and the K-nearest neighbors method. It was established that the obtained research results have applied significance associated with extracting the necessary information from the dataset for further analysis. There is also theoretical significance associated with the choice of the random forest method. The use of the method allows to increase the accuracy of diagnosis of connective tissue dysplasia and reduces the time of its implementation. The developed web application accelerates the diagnosis of pathological conditions associated with connective tissue dysplasia and increases its accuracy. Thanks to the data obtained, doctors make individual decisions on further treatment of each patient, which helps to improve the quality of treatment of sick children and optimizes the activities of medical institutions. The web application has the prospect of further use in the diagnosis of other diseases.
connective tissue dysplasia
children
information technology
web application
optimization of medical institutions

Введение. Под термином «дисплазия» принято понимать обширный ряд заболеваний, которые связаны с врожденным нарушением строения и функции соединительной ткани организма человека [1]. У таких больных, наряду с серьезными клиническими проявлениями болезни, значительно ухудшается качество их жизни [2; 3].

Дисплазия соединительной ткани изучается относительно давно [4; 5]. При этом присутствует дискуссия по унифицированным диагностическим подходам к этой патологии. Разработанные некоторые методики диагностики (Милковской-Димитровой Т., 1987; Аббакумовой Л.Н., 2006; Кадуриной Т.И., 2008) позволили значительно упростить работу врача, связанную с выявлением и классификацией этой патологии. Несмотря на существование данных методов, диагностика ряда форм диспластических проявлений, особенно на начальных этапах, всё ещё представляет сложности. Полиморфизм симптоматики данной патологии расширяет клиническую картину, затрудняет постановку диагноза и требует значительного времени на дифференциальную диагностику.

Современные компьютерные технологии применяются в разнообразных областях, и их внедрение в медицину становится одним из перспективных направлений последнего десятилетия [6-8]. Использование методов цифрового обучения врачей в различных сферах медицины позволяет вывести её на новый, более эффективный уровень.

Вопросы внедрения IT-технологий особенно актуальны для использования в области детской хирургии и педиатрии. Медицинскими специалистами [9] делается вывод о необходимости использования пакетов компьютерных программ, направленных на повышение результативности диагностики, лечения и диспансеризации детей с диагнозом «дисплазия соединительной ткани». Цифровая информатизация системы здравоохранения является основой её модернизации и инструментом в инновационных технологиях [10; 11]. Однако вопросы, связанные с разработкой и апробацией IT-технологий для пациентов с дисплазией соединительной ткани, освещены в литературе не в полной мере.

Цель исследования: разработать и внедрить в практическую деятельность врача-педиатра первичного амбулаторно-поликлинического звена веб-приложение, которое позволит сократить время обследования пациента и увеличить точность постановки диагноза заболеваний, связанных с дисплазией соединительной ткани по данным рентгенологического обследования и электронейромиографии мышц спины.

Материал и методы исследования

Сбор и анализ результатов наблюдений за 254 детьми со средним возрастом 5,7±0,8 года с дисплазией соединительной ткани проводили с 2014 по 2024 год на базе клиник Алтайского государственного медицинского университета. Для диагностики заболевания соединительной ткани использовали критерии включения и исключения. Критериями включения были не менее 5 симптомов: гипермобильность суставов, увеличенная растяжимость кожи, сколиоз, врожденный вывих либо дисплазия тазобедренных суставов, самопроизвольный пневмоторакс, нефроптоз, удвоение почек и/или мочевыводящих путей, увеличенная кровоточивость, миопия. Критерии исключения: наличие менее 5 симптомов дисплазии соединительной ткани, синдром Марфана, незавершенный остеогенез, отсутствие согласия родителей детей на участие в исследовании.

При создании веб-приложения для диагностики дисплазии соединительной ткани у детей использовали набор данных рентгенологических и лабораторных наблюдений. В него вошли материалы лонгитюдных наблюдений, содержащий необходимую информацию о результатах мониторинга пациентов с дисплазией соединительной ткани. Большая часть датасета – это показатели проведенных обследований детей: биохимический анализ крови (кальций сыворотки крови, фосфор сыворотки крови, оксипролин сыворотки крови); биохимический анализ мочи (экскреция кальция, экскреция фосфора и экскреция оксипролина); компьютерная стабилометрия; электронейромиографическое исследование; рентгенологическое исследование позвоночника, которое включает оценку контуров замыкательных пластинок, определение наличия остеопороза тел позвонков, клиновидной формы тел позвонков, остеохондроза, грыжи Шморля, уменьшения высоты межпозвоночного диска и изменения контуров апофизов.

На первом этапе создания веб-приложения была проведена очистка используемых фактических данных. Эта работа предусматривала разметку используемого материала, удаление из него различных ошибок и неточностей, внесение пропущенных или отсутствующих параметров, осуществление процесса нормализации и стандартизации.

Из многочисленных методов и средств компьютерного обучения медицинских кадров, которые используются для анализа медицинских данных, были выбраны и апробированы следующие: логистическая регрессия, линейный дискриминантный анализ, дерево решений, «случайный лес» и метод K-ближайших соседей [8; 12].

Результаты исследования и их обсуждение. Для применения указанных выше методов к анализу данных о пациентах с дисплазией соединительной ткани использовали стандартную библиотеку языка программирования Python – Scikit-Learn. Она позволяет реализовать множество методов для визуализации, классификации, кластеризации и других технологий интеллектуального анализа вводимых данных. Гиперпараметры методов подбирали с использованием модуля GridSearchCV из этой библиотеки. Этот модуль автоматически определяет оптимальные параметры моделей путём упорядоченного перебора.

В результате были подобраны следующие гиперпараметры:

- дерево решений (class_weight = 'balanced', criterion = 'gini', max_features = 'sqrt', max_depth = 20, min_samples_leaf = 8, min_samples_split = 16);

- случайный лес (class_weight = 'balanced', criterion = 'gini', max_features = 'sqrt', max_depth = 20, min_samples_leaf = 8, min_samples_split = 16, bootstrap = False, n_estimators = 50);

- логистическая регрессия (class_weight = 'balanced', C = 1000, penalty = 'l1', solver = 'liblinear', multi_class = 'ovr');

- линейный дискриминантный анализ (solver = 'svd', store_covariance = True, tol = 1.0e-8);

- метод K-ближайших соседей (n_neighbors = 2, p = 1, weights = 'uniform', algorithm = 'auto').

В качестве целевых переменных выступают следующие виды патологических проявлений, связанные с дисплазией соединительной ткани, диагностируемых при помощи дополнительных методов обследования:

1) электронейромиографическое исследование – изменение мышечного тонуса;

2) рентгенологическое исследование - изменение контуров замыкательных пластинок; остеопороз тел позвонков; клиновидная форма тел позвонков; ранний юношеский остеохондроз; грыжи Шморля; уменьшение высоты межпозвоночного диска; изменение контуров апофизов. Обозначенные изменения проявляются как во внешних, так и во внутренних структурах организма человека.

Для оценки эффективности моделей классификации были использованы следующие функции из библиотеки sklearn.metrics:

1. Коэффициент корреляции Мэтьюса (matthews_corrcoef) – использовался для оценки адекватности моделей.

(1)

2. Метрика Accuracy (accuracy_score) – характеризует общую точность предсказания модели, представляя собой долю всех правильно классифицированных наблюдений.

, (2)

где

TP – количество истинных положительных показателей;

TN – количество истинных отрицательных показателей;

FP – количество ложных срабатываний;

FN – количество значений, ложно свидетельствующих об отрицательном результате.

В таблице 1 представлены данные о качестве методов по 5-блоковой перекрестной проверке (mcc) после нахождения оптимальных гиперпараметров. Использование перекрестной проверки показало адекватность метода применительно к имеющимся показателям, что согласуется с выводами других исследователей [13].

Таблица 1

Коэффициент корреляции Мэтьюса

Перекрестная проверка

LR

LDA

DT

RF

KNN

mcc

0.927

0.796

0.869

0.905

0.849

Установлено, что методы машинного обучения медицинских кадров свидетельствуют о разных результатах в когорте представленных данных. Так, логистическая регрессия и «случайный лес» дали лучшее качество по перекрестной проверке по сравнению с остальными методами и являются более устойчивыми относительно гиперпараметров. Это можно отнести к показателям их адекватности применительно к анализируемым данным [14].

Также проводили оценку приемлемости моделей компьютерного обучения среди врачей и их толерантность по отношению к гиперпараметрам. После этого проводили проверку уже обученных моделей на тестовом наборе показателей, который не участвовал в поиске гиперпараметров и параметров моделей. Данная проверка позволяет описать прогностическую способность модели и определить, насколько качественно и эффективно она может быть реализована врачом на практике. Для этой проверки использовали показатель accuracy. Расчет его данных проводили с помощью функции accuracy_score из библиотеки Scikit-Learn. Эта функция принимает в качестве аргументов фактические и предсказанные метки и возвращает долю правильных прогнозов среди всех сделанных, что отражено в таблице 2.

Таблица 2

Качество обученных моделей

Параметры патологических

отклонений

LR

LDA

DT

RF

KNN

Изменение контуров замыкательных

пластинок

0.757

0.766

0.724

0.792

0.712

Клиновидная форма тел

позвонков

0.775

0.775

0.781

0.781

0.771

Грыжи Шморля

0.979

0.985

0.976

0.979

0.958

Остеопороз тел позвонков

0.695

0.668

0.681

0.706

0.653

Уменьшение высоты межпозвоночного диска

0.973

0.976

0.976

0.976

0.973

Изменение контуров апофизов

0.955

0.961

0.961

0.958

0.925

Остеохондроз

0.961

0.973

0.967

0.967

0.952

Электронейромиографические изменения мышц спины

0.911

0.911

0.866

0.891

0.837

При анализе показателей таблицы 2 установлено:

1. Достоверно визуализируются грыжи Шморля, уменьшение высоты межпозвоночного диска, изменение контуров апофизов и остеохондроз.

2. Сомнительно рентгенологически визуализируется остеопороз тел позвонков.

Рассмотренные методы машинного обучения показали значимые достоверные результаты на имеющиеся данные. Для интеграции в веб-приложение был выбран «случайный лес». Это связано с отсутствием жестких требований по предобработке данных, лучшей обобщающей способностью и стабильностью по сравнению с другими методами.

В решении данной задачи менее эффективно и достоверно показал себя метод K-ближайших соседей. Это связано с понятием «проклятие размерности». Оно заключается в том, что все изучаемые критерии становятся почти одинаковыми по отношению друг к другу, что очень затрудняет их дифференциацию.

Для хранения полученной информации была спроектирована и разработана структурированная база данных. Для этого использовали систему управления базами данных (СУБД) PostgreSQL [6].

База данных состоит из шести основных таблиц, которые включают: архив пациентов, анализы, результаты диспансеризации, группы, пользователи и роли. Также база включает пять дополнительных таблиц, которые обеспечивают связь между основными таблицами и предоставляют информацию о взаимосвязях между ними.

Существование базы данных позволяет медицинским специалистам оптимально и результативно осуществлять регистрацию и учет пациентов, вести историю их болезни, назначать лечение и проводить дальнейший мониторинговый контроль. Кроме того, с использованием базы данных можно проводить анализ распространённости патологий, совершенствовать классификацию и модернизировать другие производственные процессы.

Следующим этапом исследовательской работы было создание веб-приложения, которое должно помочь в диагностике патологий, связанных с дисплазией соединительной ткани. К его функционалу были прикреплены следующие обязательные требования:

- регистрация новых пациентов или ввод уже существующих данных;

- реализация доступа к имеющемуся материалу мониторинга данных;

- возможность пополнения данных из внешних источников;

- визуализация данных, этапов и результатов диагностики;

- возможность вывода результатов для дальнейшего анализа и использования.

Разработанное приложение представлено в виде онлайн-сервиса, что позволяет обращаться к нему с любого устройства, имеющего доступ к сети Интернет [13]. При его создании применялся фреймворк ASP.NETCORE, а также следующие языки программирования и сервисы:

- серверная часть: C#, Python;

- клиентская часть: HTML, CSS и JavaScript;

- вспомогательные сервисы: GitHub (сохранение модели и файлов, обеспечивающих работу приложения) и Docker (контейнеризация приложения для дальнейшего размещения на хостинге);

- база данных: для создания использовался PostgreSQL.

Техническая структура разработанного веб-приложения показана на рисунке 1.

 

Рис. 1. Структура веб-приложения [15]

Веб-приложение имеет следующие блоки:

- информационный модуль - включает общую информацию о функциональных возможностях приложения и внесенных исправлениях;

- модуль безопасности материала - обеспечивает достоверность и целостность информации, осуществляет контроль доступа лиц к имеющимся данным;

- панель управления админа - предоставляет доступ к скрытым элементам веб-приложения и регулирует уровень привилегий доступа для пользователей;

- личный кабинет - предоставляет пользователю доступ к своим персональным страницам;

- модуль базы данных мониторинга - обеспечивает доступ к данным, функционал которого позволяет осуществлять добавление, исправление и удаление данных;

- модуль анализа представленных данных - осуществляет диагностику патологических состояний, на основе различных клинико-лабораторных материалов.

Организация основных модулей веб-приложения показана на рисунке 2.

 

Рис. 2. Модули веб-приложения [16]

Приложение предоставляет возможность визуализации данных в виде графиков, в частности графика распространённости дисплазии соединительной ткани, показывающего количество пациентов с данной патологией; графика распределения показателей, который показывает частоту вхождения значений показателя в заданные диапазоны.

Модуль «Анализ данных» проводит диагностику патологических состояний, связанных с дисплазией соединительной ткани у пациентов детского возраста, на основе имеющихся данных и созданной модели компьютерного обучения. В поля вводятся значения показателей, после чего они передаются в модель для дальнейшей классификации. Результаты классификации выводятся в отдельную таблицу.

Заключение

Полученные результаты исследования могут быть использованы в практическом здравоохранении на этапе первичного амбулаторно-поликлинического звена. Разработанное приложение способно извлекать и накапливать информацию и в дальнейшем использовать её в своей профессиональной деятельности. Созданное веб-приложение ускоряет диагностику и улучшает её точность, что способствует оптимизации работы медицинских учреждений. Возрастает возможность принятия индивидуальных решений о дальнейшем лечении пациента. Разработанное веб-приложение по диагностике дисплазии соединительной ткани по данным рентгенологического обследования и электронейромиографии мышц спины может быть использовано в будущих научных и клинических исследованиях. В перспективе планируется расширение веб-приложения с включением в него материала клинических наблюдений.