Scientific journal
Modern problems of science and education
ISSN 2070-7428
"Перечень" ВАК
ИФ РИНЦ = 1,006

RESEARCH OF BIOSYSTEMS'S CONDITION BASED ON NEURAL NETWORKS TECHNOLOGIES

Gerget O.M. 1 Berestneva O.G. 1 Glot K.Yu. 1
1 National Research Tomsk Polytechnic University
Approach to a complex estimation of a dynamic systems condition, considered as a biosystems, based on the Neural Networks technologies, allowing to receive qualitatively new scientific and practical conclusions, essentially accelerating and facilitating medical personnel work in an estimation of a children´s health state in the early neonatal period, is presented. In this work the data about a health state of 330 children, observed in the health center and children´s hospital of Tomsk, is studied. The result of this research is the assignment of the object (health state) to one of the disease classes: prenatal hypoxic central nervous system (PPTSNS), hypoxic-traumatic PPTSNS, healthy. The architecture of a neural network is proved; a technique of informative signs allocation; stages of the construction, training of a neural network; accuracy of the taking decision with the help of the neural network; results of the research are represented. The model antenatal forecasting and abilitation of perinatal defeats of the central nervous system at children of the first year of a life is developed.
neural networks
acceptance of decisions
cluster analysis
health
children in early neonatal period.
Введение

Особую роль в математическом моделировании биосистем играют методы моделирования динамических систем. Динамической называют систему, изменяющую под действием сил свое состояние. Совокупность всевозможных состояний системы образует пространство состояний (фазовое пространство).

Одним из эффективных способов поддержания сложных динамических систем в требуемом состоянии является совершенствование и развитие алгоритмического диагностического контроля показателей их функционирования (состояния) [7].

В работе рассмотрена возможность применения нейросетевых технологий в исследовании динамических систем на примере биосистем (организма детей в раннем неонатальном периоде).

Большой вклад в разработку методов оценки состояния здоровья детей внесли специалисты как в области медицины, так и в области математики. Группа ученых (Томский политехнический университет) описала способ прогнозирования состояния здоровья детей на первом году жизни, основанный на математических методах анализа с построением прогностических таблиц и уравнений регрессии [9]. Ю.А. Батман (Донецкий государственный медицинский университет) построил модель для прогнозирования развития дезадаптационного синдрома и асфиксии у новорожденных. Он определил информационные веса каждого критерия, позволившие прогнозировать перинатальные осложнения у новорожденного в зависимости от состояния беременной и плода [2]. В настоящее время существует немало работ, посвященных разработке математических методов оценки состояния здоровья детей, однако в связи с тем, что данные биомедицинских исследований представляют собой объединение малых целенаправленных выборок, отличаются неполнотой и нечеткостью задания признаков, вариабельностью за счет внутри- и межиндивидуальных различий, сложностью описания биосистемы, проблема оценки состояния здоровья детей является актуальной по настоящее время. Таким образом, целью настоящей работы является оценка состояния биообъектов на основе нейросетевых подходов.

Выявление информативных показателей.

Применение в диагностических целях нейронной сети

Для экспериментального исследования были использованы данные, предоставленные Лечебно-оздоровительным центром «Здоровая мама, крепкий малыш» и детской больницей № 1 г. Томска.

В ходе работы были проведены исследования на выборке из 330 детей, которые были разделены на 3 группы по состоянию здоровья: гипоксическое перинатальное поражение центральной нервной системы (ППЦНС) - 120 детей (в таблице обозначена «1»), гипоксически-травматическое ППЦНС - 120 детей (в таблице обозначена «2») и группа здоровых детей - 90 детей (в таблице обозначена «0»).

При проведении исследований важную роль играет достаточность и достоверность выборки. В ходе проведения статистической обработки выборки было установлено, что в каждой группе должно быть не менее 75 детей. При этом точность полученного результата будет составлять 90%.

Диагноз ставился на основании лабораторных показателей. По оценкам экспертов, необходимыми показателями для постановки данных диагнозов являются показатели клетки (метод кариографии) и показатели нейросонографии. Для исследования были использованы 4 показателя анализа крови и 12 показателей нейросонографии.

На первом этапе необходимо определить, какие показатели наиболее точно отражают диагноз и состояние здоровья новорожденного. Исследование проведем при помощи кластерного анализа [6]. Существует множество различных алгоритмов кластеризации, однако использован метод k-средних, так как заранее известно число кластеров, на которые будет разбита данная выборка.

Кластерный анализ осуществлялся для трех выборок по показателям: a) крови (кариометрии); б) нейросонографии; в) крови и нейросонографии в совокупности.

Выборка была разбита на 3 группы, что позволило составить диагностическую таблицу диагнозов для каждой полученной группы.

По оценке экспертов было выявлено, что наилучшим образом выборка была разбита в третьем случае в соответствии с диагнозами детей, следовательно, наилучший результат достигается в случае объединения показателей клеток крови и показателей нейросонографии. Отметим, что отдельно показатели нейросонографии, на которые опираются в постановке диагнозов врачи, не дают желаемого результата. Только совокупность показателей дает возможность оценить всю картину состояния ребенка.

Таким образом, с помощью кластерного анализа было выявлено, что наиболее точно отражают состояние ребенка при вышеперечисленных диагнозах совокупность 4 показателей крови (кариометрии) и 12 показателей нейросонографии [3].

На втором этапе была построена нейронная сеть, результатом которой является отнесение объекта к одному из классов вышеперечисленных заболеваний. В качестве входных параметров данной нейронной сети использованы наиболее информативные показатели, выявленные на предыдущем шаге исследования.

Нейронная сеть представляет собой совокупность нейронов-элементов, связанных между собой определенным образом. Нейроны и межнейронные связи задаются программно. Функционирование нейрона в нейрокомпьютере или нейропрограмме отдаленно напоминает работу биологического нейрона. Функционирование формального нейрона происходит следующим образом.

В текущий момент времени нейрон получает по дендритам сигналы от других нейронов. Такие сигналы называются входными. Сигнал с каждого входа умножается на весовой коэффициент этого входа и складывается с другими сигналами (также умноженными на весовые коэффициенты соответствующих входов). В зависимости от полученного значения формируется выходной сигнал, передающийся другим нейронам по закону:

,

где n - число входов нейрона; xi - значение i-го входа нейрона; wi - вес i-го синапса [5].

В качестве входных данных для нейросети будут использованы параметры клетки и результаты нейросонографии. Задача заключалась в обучении нейронной сети с 16 входами, которые представляют собой показатели лабораторных исследований, и 1 выходом, который определяет диагноз.

Работа с нейронной сетью была осуществлена в пакете NNT MatLab. Пакет NNT MatLab представляет полноценную среду MatLab для решения прикладных задач с использованием нейросетевых технологий.

Работа с нейронной сетью начинается с подготовки данных.

Пакет NNT MatLab не требует нормализации данных для работы с нейронной сетью, однако в связи с большой вариабельностью признаков мы нормализовали данные в соответствии с диагнозом. При нормализации показателей был использован принятый в биокибернетике способ выделения градаций на уровне  характеризующих степень отклонения показателя от нормы [1].

В соответствии с этими положениями выделено 3 условных состояния пациентов [5]:

0 - удовлетворительное состояние; 0,5 - состояние средней тяжести; 1 - тяжелое состояние.

В качестве входных данных для нейронной сети использованы нормализованные данные показателей крови и нейросонографии, которые представлены в виде матрицы размерностью 16×330, где количество строк равно количеству входов нейронной сети, количество столбцов равно количеству объектов для обучения нейросети.

Выходные данные обучаемой нейронной сети представлены значениями диагнозов:

0 - здоровые; 1 - гипоксическое ППЦНС; 2 - гипоксически-травматическое ППЦНС.

Для обработки в пакете NNT MatLab эти данные представлены в виде матрицы размерностью 1×330, где количество строк равно количеству выходов нейронной сети.

Выборка была разбита на 2 группы: обучающая (165 детей) и тестируемая (165 детей).

В качестве итогового принятия решения использовалась модель трехслойной сети и алгоритм обратного распространения в качестве обучающего. Трехслойная сеть с обратным распространением ошибки является эффективной для большинства приложений. Данный тип сети используется в 95% задач классификации с помощью нейронной сети и тренируется гораздо быстрее, чем 4- или 5-слойные сети. Этот тип нейронных сетей исследован довольно хорошо [8].

Алгоритм обратного распространения ошибки

Приведем используемый в работе алгоритм обратного распространения ошибки.

  1. Инициализация синаптических весов малозначительными случайными значениями.
  2. Выбор очередной обучающей пары из обучающего множества; передача входного вектора на вход сети.
  3. Вычисление выхода сети.
  4. Определение разности между выходом сети и требуемым выходом (целевым вектором обучающей пары).
  5. Корректировка весов сети для минимизации ошибки. Повтор шагов со 2 по 5 для каждого вектора обучающего множества до тех пор, пока ошибка на всем множестве не достигнет приемлемого уровня [10].

Выбор правильного количества нейронов в скрытых слоях является очень важным. Слишком малое количество нейронов может привести к тому, что сеть не сможет обучиться. Слишком большое повлечет за собой увеличение времени обучения сети до нереального значения.

Количество нейронов в скрытом слое определялось по формуле:

      ,  (1)

где Nвх; Nвых - размерность входного/выходного сигнала; Q - число элементов множества обучающей выборки.

Число нейронов входного слоя определяется числом входных факторов задачи, выходного слоя - числом выходных факторов.

В нашем случае Nвх=16; Nвых=3; Q=165. Таким образом, подставив данные в (1), получим N=22.

В качестве активационной функции использована сигмоидальная активационная функция:                                           

где α - параметр наклона функции. Многослойные нейронные сети обладают большими способностями, чем однослойные, только в случае наличия нелинейности. Сигмоидальная функция обеспечивает нелинейность. Для алгоритма обратного распространения ошибки существует следующее ограничение: функция должна быть всюду дифференцируема. Сигмоидальная функция удовлетворяет этому требованию. Следует отметить, что такая функция автоматически контролирует усиление. Для слабых сигналов (т.е. когда  близко к нулю) кривая вход-выход имеет заметный наклон, дающий большое усиление. Когда величина сигнала становится больше, усиление падает. Таким образом, большие сигналы воспринимаются сетью без насыщения, а слабые сигналы проходят по сети без чрезмерного ослабления [10].

Рассмотрим обучение данной нейронной сети по этапам.

На первом этапе на вход нейронной сети подается один из 165 образов из обучающей выборки и, проведя данный образ через функцию активации, определяются значения выходов нейронов нейросети.

Поскольку обучение нейросети производится методом градиентного спуска, то изменение веса выходного слоя N производится как:

где  yj  - значение j-го выхода нейросети; dj  - целевое значение j-го выхода; S - состояние выходного нейрона.

Далее рассчитываются изменения весов для остальных слоев нейронной сети:  

      

где

После этого корректируются веса нейронной сети:

Рассчитывается ошибка целевой функции ошибки нейронной сети:

где yj - значение j-го выхода нейросети; dj - целевое значение j-го выхода; p - количество обработанных сетью примеров.

Если ошибка существенна, то переходят на первый этап обучения.

Приведем извлечения из таблицы результатов [4], полученных в процессе обучения сети (таблица 1).

Таблица 1 - Извлечения из таблицы результатов

Результат

Выход сети

Разность результат - выход сети

0,00

0,03

-0,03

1,00

1,01

-0,01

2,00

2,00

0,00

1,00

0,89

0,11

2,00

1,91

0,09

2,00

2,00

0,00

1,00

0,98

0,02

2,00

2,00

0,00

1,00

0,55

0,45

2,00

2,00

0,00

2,00

2,00

0,00

0,00

0,00

0,00

...

...

...

Ошибка работы нейронной сети составляет 14,2%. Следовательно, точность полученного результата составляет 85,8%. Это говорит о том, что сеть обучена достаточно хорошо и может быть использована в качестве дополнительного подхода в медицинских исследованиях. В медицинской практике точность постановки правильного диагноза составляет 87%.

Заключение

Принятие решения о состоянии биосистемы (состояние организма ребенка в раннем неонатальном периоде) на основе нейронных сетей апробировано на тестовых примерах при задании разных значений информативных признаков, входящих в описание исследуемого объекта и выявленных с помощью кластерного анализа.

Полученные результаты могут быть использованы при создании системы поддержки принятия решений, которая позволит выдавать рекомендации о необходимости проведения дополнительного обследования, а также на основе полученных данных даст возможность оперативно оценить состояние здоровья ребенка и скорректировать программу лечения.

Рецензенты:

  • Фокин Василий Александрович, д.т.н, доцент, профессор каф. биологической и медицинской кибернетики ГБОУ ВПО «Сибирский государственный медицинский университет», г. Томск.
  • Силич Виктор Алексеевич, д.т.н., профессор ФГБОУ ВПО «Национальный исследовательский Томский политехнический университет» Министерства образования и науки РФ, г. Томск.