Scientific journal
Modern problems of science and education
ISSN 2070-7428
"Перечень" ВАК
ИФ РИНЦ = 1,006

APPROACHES TO MATHEMATICAL MODEL DEVELOPMENT FOR PREDICTING THE TRASPLANTED TUMOR MANIFESTATION SPEED IN A MOUSE MODEL OF HUMAN BREAST CANCER

Aronov D.A. 1, 2 Zhukov V.V. 3 Moiseeva E.V. 1 Semushina S.G. 1 Shishkin A.M. 4 Bozhenko V.K. 4
1 Shemyakin-Ovchinnikov Institute of bioorganic chemistry, Russian Academy of Sciences
2 FSBI National medical research center for obstetrics, gynecology and perinatology Ministry of healthcare of the Russian Federation
3 The Russian university of friendship of the people
4 FSBI "Russian Scientific Center of Roentgenoradiology" Ministry of healthcare of the Russian Federation
Tumor growth rate prediction is necessary for developing a therapeutic strategy for breast cancer (BC) patients. Concomitant pathologies of internal organs were shown to determine the patient outcome. We suggested that such pathologies could also affect the dynamics of tumor growth, thus, hematological and biochemical parameters of blood and serum, which reflect the presence of anemia, disorders of the hemostatic system, diseases of the liver and cardiovascular system, could serve as informative markers for predicting the growth of the tumor. To test this hypothesis, a transplantable mouse model of human BC was used. The number of erythrocytes, hemoglobin, hematocrit, average erythrocyte volume, average erythrocyte hemoglobin content, average erythrocyte hemoglobin concentration, erythrocyte volume distribution, platelet count, plateletcrit, the width of the distribution of platelets, the number of leukocytes, the proportion of lymphocytes, monocytes, eosinophils, band neutrophils, segmented neutrophils, cholesterol, triglycerides, total protein, albumin, urea, creatinine, aspartate aminotransferase, alanine aminotransferase, bilirubin, alpha-amylase, LDH, alkaline phosphatase and creatine kinase were measured in peripheral blood of intact males of the original BLRB-Rb(8.17)1Iem mouse strain. After 2 weeks, the naturally occurred tumor of the syngeneic female was transplanted to males of BLRB mouse strain. Two weeks after tumor inoculation, the males were divided into groups with early and late manifestation of the tumor (diameter greater or less than 3.5 mm). A mathematical model based on the logistic regression allowed us to obtain satisfactory results of classification mice into groups according to the rate of tumor manifestation and based on the set of informative laboratory parameters. These results demonstrate that such parameters could be used to predict the growth rate of breast cancer, which indirectly proves the influence of background pathologies at the time of the onset of the tumor on the growth of breast cancer.
breast cancer
mathematical model
hematological blood parameters
biochemical blood parameters

Рак молочной железы (РМЖ) является наиболее распространенным онкологическим заболеванием у женщин в России. Морфологическое разнообразие типов РМЖ определяет различия в скорости роста опухоли у пациентов. Как клинический исход пациента [1], так и исход терапии (в частности, химиотерапии [2]) может зависеть от динамики опухолевого роста, поэтому заблаговременный прогноз роста РМЖ необходим для выбора наиболее оптимального терапевтического подхода для пациента. Наличие фоновых заболеваний при РМЖ, как правило, отягощает течение болезни, хотя до сих пор не выявлено связи между патологией внутренних органов и степенью агрессивности РМЖ [3]. При этом давно известно, что ряд гематологических и биохимических показателей крови и сыворотки, являющихся клиническими маркерами заболеваний органов и систем, можно применять для прогноза исхода пациентов с РМЖ [4, 5]. Также известны изменения таких показателей у женщин с диагностированным РМЖ по сравнению со здоровыми донорами [6, 7] в зависимости от стадии заболевания [8, 9] и проводимой терапии [10, 11]. Мы предположили, что некоторые патологические процессы внутренних органов, о которых можно косвенно судить по гематологическим и биохимическим показателям крови и сыворотки, могут оказывать влияние на скорость проявления перевитой опухоли. Для проверки этого предположения в эксперименте in vivo и выявления информативных биомаркеров для прогноза скорости проявления опухоли необходимо применять адекватные мышиные модели РМЖ человека. Существенное влияние на рост опухоли оказывают качественный и количественный состав микроокружения на местном уровне, а также возраст, половые гормоны и иммунный статус реципиента на системном уровне. Чтобы нивелировать значение этих факторов, необходимо унифицировать реципиентов в исследовании. Для этого наиболее подходящей моделью можно считать перевиваемую мышиную модель РМЖ с использованием стареющих самцов высокораковой линии BLRB-Rb(8.17)1Iem (далее – BLRB) одного возраста, содержащихся в конвенциональных (не-SPF) условиях. Таким образом, перевивка естественно возникшей опухоли от сингенной самки унифицирует показатели опухолевого микроокружения; пол и возраст реципиентов уравняют их гормональный и иммунный статус, а конвенциональные условия содержания создадут возможность для развития фоновых возраст-ассоциированных патологий внутренних органов, схожих с таковыми у пациентов с РМЖ.

Цель исследования: продемонстрировать возможность создания математической модели для прогноза скорости проявления перевитой опухоли на основании гематологических и биохимических показателей крови и сыворотки, измеренных у интактных мышей до перевивки им опухоли.

Материалы и методы исследования. Использовали перевиваемую мышиную модель РМЖ. У самцов мыши линии BLRB (n=64), характеризующейся высокой частотой естественно возникающего РМЖ у стареющих самок, за две недели до перевивки опухоли взяли образцы крови объемом 200±50 мкл; с помощью гематологического анализатора «MICROS 60 OT-18» (ABX, Франция) измеряли следующие показатели: количество эритроцитов (RBC), гемоглобина (HGB), гематокрит (HCT), средний объем эритроцита (MCV), среднее содержание гемоглобина в эритроците (MCH), среднюю концентрацию гемоглобина в эритроците (MCHC), ширину распределения эритроцитов (RDW), количество тромбоцитов (PLT), тромбокрит (PCT), средний объем тромбоцитов (MPV), ширину распределения тромбоцитов (PDW), количество лейкоцитов (WBC), долю лимфоцитов (LY), моноцитов (MO), эозинофилов (EO). Лейкоцитарную формулу определяли путем микроскопического анализа мазков крови, окрашенных по Романовскому–Гимзе. С помощью биохимического анализатора «COBAS FARA» (Roche, Швейцария) в сыворотке крови измерили следующие маркеры: уровень холестерина (CHOL), триглицеридов (TRIG), общего белка (TP), альбумина (ALB), мочевины (UREA), креатинина (CREA), аспартатаминотрансферазы (AST), аланинаминотрансферазы (ALT), билирубина (BIL), альфа-амилазы (AMYL), лактатдегидрогеназы (LDH), щелочной фосфотазы (ALP) и креатинкиназы (CK). Спустя две недели гомогенат, полученный из естественно возникшей опухоли сингенной с реципиентами самки, инъецировали в жировую подушечку в область правых подмышечных лимфатических узлов в дозе 107 клеток/мышь. Еженедельно измеряли средний диаметр опухоли, как описано в [12]. На день 13 после перевивки опухоли самцов классифицировали на: группу 1 (быстро проявляющиеся опухоли, n=18, диаметр >3,5 мм на день 13) и группу 2 (медленно проявляющиеся опухоли, n=46, диаметр <3,5 мм на день 13). Далее проводили разведочный анализ данных для определения показателей, оптимальных для построения модели прогноза. В качестве математической модели индивидуального прогноза скорости проявления опухоли использовали логистическую регрессию. Реализация модели выполнена на языке Python 3.8 с использованием модуля scikit-learn 0.22.

Результаты исследования и их обсуждение

В качестве критерия быстрого (n=18) или медленного (n=46) проявления РМЖ использовали среднее значение диаметра опухолевого узла в 3,5 мм на день 13 после перевивки. Опухоль диаметром менее 3,5 мм возможно диагностировать только путем пальпации тканей молочной железы (период до клинического проявления – субклинический период), в то время как новообразования, размер которых превышает это значение, можно диагностировать визуально. День 13 был выбран в качестве медианного значения окончания субклинического периода роста опухоли в популяции самок с естественно возникшим РМЖ [13]. Целесообразность такого подхода была подтверждена математически путем аппроксимации индивидуальной динамики роста опухоли для каждого реципиента. Общая закономерность роста перевитой опухоли в данной модели заключается в наличии трех этапов: 1) размер опухолевого узла начинает нарастать экспоненциально (субклинический период); 2) скорость роста снижается, и размер опухолевого узла начинает увеличиваться линейно; 3) скорость роста замедляется еще сильнее, а размер опухолевого узла остается практически неизменным. Такое поведение динамики роста с математической точки зрения можно описать сигмоидой – гладкой монотонной нелинейной функцией, имеющей форму буквы S, в частности логистической функцией (уравнение Ферхюльста, часто используемое в экологии для описания динамики роста некоторой популяции в условиях ограниченности ресурсов, рис. 1).

а

Рис. 1. А – логистическая функция, разделенная на три части, соответствующие трем фазам роста: а – начальная (экспоненциальная) фаза роста, б – фаза линейного роста, в – фаза плато; Б – приближение логистической функцией средних размеров образований (с указанием 95%-ного ДИ), R2 = 0,996

Для определения момента перехода между фазами экспоненциального и линейного роста динамика роста опухолевого образования для каждой мыши аппроксимировалась логистическим уравнением (1). Подбор неизвестных параметров осуществлялся методов наименьших квадратов.

(1)

Момент перехода между первым и вторым этапами характеризовался как пик увеличения скорости роста опухоли, после которого наступал обратный процесс – сначала темпы увеличения скорости роста начинали постепенно снижаться, а затем снижалась и сама скорость. Математически это соответствует максимуму второй производной логистической функции (рис. 2).

Рис. 2. А – приближение динамики роста отдельной мыши логистической функцией;

Б – график второй производной заданной функции; вертикальная черта соответствует максимальному значению второй производной функции – моменту перехода между первым и вторым этапами роста образования

Расчет дня перехода к линейному периоду роста опухоли показал, что в среднем это происходит на 16-й день после перевивки (медиана 15,3; 95%-ный ДИ: 10,9–20,4) при среднем диаметре опухолевого узла 3,55 мм. Полученные результаты подтверждают биологическое обоснование определения субклинического периода. День 13 был подтвержден в качестве оптимального критерия для разделения популяции самцов на группу 1 (быстрое проявление опухоли: диаметр >3,5 мм на день 13) и группу 2 (медленное проявление опухоли: диаметр <3,5 мм на день 13) как наиболее близкий к теоретическому среднему дню окончания первой фазы роста.

Далее на этапе разведочного анализа данных было проведено исследование основных характеристик параметров и взаимосвязей между ними. Оценка нормальности распределений параметров проводилась с использованием критерия Шапиро–Уилка. Большая часть параметров не имела нормального распределения из-за наличия выбросов, которые можно объяснить наличием у части реципиентов патологий внутренних органов. В таких случаях распределение параметра приводили к нормальному путем степенного преобразования.

Далее были исследованы корреляции между параметрами роста РМЖ и показателями крови и сыворотки, проведено сравнение средних значений (t-критерия Стьюдента, U-критерия Манна–Уитни) и дисперсий (критерия Фишера, критерия Ансари–Бредли) параметров в группах с быстрым и медленным проявлением РМЖ. Средние значения показателей по группам не отличались статистически значимо, хотя стоит отметить наличие некоторых тенденций к различиям по уровням TP (p=0,07), HCT (p=0,09), RBC (p=0,10), MCHC (p=0,19), TRIG (p=0,19). Анализ дисперсий показал различия между группами с быстрым и медленным проявлением РМЖ для параметров HGB (p=0,03), ALB (p=0,02), ALT (p=0,03). В заключительной части разведочного анализа данных были рассмотрены корреляции и совместные распределения показателей крови и сыворотки. Некоторые параметры образуют сильно коррелирующие группы, которые можно объяснить с биологической точки зрения (например, RBC, HGB и HCT отражают основные характеристики эритроцитов, тогда так PLT, PCT, MPV – тромбоцитов). Такие группы в свою очередь могут иметь значимые обратные корреляции с параметрами других групп (например, группа RBC, HGB, HCT имеет умеренную обратную корреляцию с группой MCH, MCHC). Такие взаимосвязи накладывают ограничение на прямое использование параметров в качестве предикторов в математических моделях, так как большое количество методов (например, линейный дискриминантный анализ) предполагает некоррелированность факторов. Исследование совместных распределений не показало явной возможности разделения групп с быстрым и медленным проявлением РМЖ линейной или нелинейной функцией. В результате было выдвинуто предположение о наличии возможности разделения групп в пространстве высокой размерности, то есть учитывающем многие анализируемые параметры.

Процесс построения предиктивной вероятностной модели классификации мышей на группы с быстрым и медленным проявлением РМЖ был организован следующим образом: 64 мыши были разделены на обучающую (n=46) и тестовую (n=18) выборки. Разделение проходило с учетом классовой стратификации (так как распределение по классам не является равномерным). Далее на обучающей выборке была построена предиктивная модель. Гиперпараметры модели определялись с использованием перекрестной проверки. Эффективность модели измерялась на тестовой выборке.

В качестве базовых параметров для построения предиктивной модели на основе результатов разведочного анализа были отобраны следующие: масса тела мыши на момент перевивки опухоли, HGB, MCV, RDW, MCHC, PCT, MPV, TP, ALB, TRIG. Структура модели была организована следующим образом. Сначала проводили степенное преобразование со стандартизацией для данных с распределением, отличным от нормального. В результате многие параметры после данного шага принимали вид стандартного нормального распределения. Далее в модель были добавлены латентные переменные, представляющие собой попарные произведения некоторых параметров. Снижение размерности после добавления латентных переменных проходило при помощи сингулярного разложения матрицы данных и отборе k максимальных сингулярных значений (оптимальное значение для k составило 20). В качестве модели классификации использовалась логистическая регрессия с L1- и L2-регуляризациями (эластичная сеть).

Результаты работы модели на тестовой выборке приведены в таблице. Чувствительность модели для группы с быстрым проявлением РМЖ составила 60%, специфичность – 84,6%, ROC AUC=0,754.

Результаты работы модели классификации на тестовой выборке

 

Наблюдаемые значения

Всего

Быстрое проявление

Медленное проявление

Предсказанные значения

Быстрое проявление

3

2

5

Медленное проявление

2

11

13

Всего

5

13

18

 

Однако данные результаты нельзя считать реферативными для оценки обобщающей способности модели, так как объем выборки достаточно мал. Оценка обобщающей способности была проведена методом Монте Карло – многократным случайным делением выборки на обучающую и тестовую, с последующим усреднением результатов. Среднее значение чувствительности составило 61% (95%-ный ДИ: 55,3–66,7%), специфичности – 69% (95%-ный ДИ: 63,9–74,1%).

Представленные результаты демонстрируют возможность построения математических моделей для прогноза динамики роста РМЖ с основой на данных общедоступных клинических тестов. Гематологические показатели HGB, MCV, MCHC и RDW являются ключевыми характеристиками состояния эритроцитов и применяются в клинике для дифференциальной диагностики анемий [14]. Уровни PCT и MPV позволяют диагностировать нарушения системы свертывания крови; лейкоцитоз и сдвиг лейкоцитарной формулы могут свидетельствовать о наличии инфекционных процессов, заболеваниях печени и почек. Следовательно, информативными оказались гематологические показатели крови, отражающие два наиболее часто наблюдаемых осложнения РМЖ: анемию и нарушения системы гемостаза [6, 15]. Общий белок сыворотки крови (TP) считается показателем баланса синтеза и расщепления или потери белков; белок альбумин (ALB) на 80% определяет коллоидно-осмотическое давление плазмы, его доля составляет половину от всех плазматических белков. Недостаток этого белка может говорить о патологических процессах в печени или сердечно-сосудистой системе. У пациентов с РМЖ часто наблюдается повышение уровня TP при снижении уровня ALB в сыворотке крови [7, 9]. Триглицериды (TRIG) являются информативным показателем липидного обмена. TRIG образуются в печени из глицерина и высших жирных кислот и попадают в кровоток в виде липопротеидов очень низкой плотности (ЛПОНП). Повышенный уровень триглицеридов часто приводит к заболеваниям сердечно-сосудистой системы и ассоциирован с высоким риском развития ишемической болезни сердца. Следовательно, биохимические показатели сыворотки крови, информативные для диагностики заболеваний печени и сердечно-сосудистой системы, оказались прогностическими маркерами для предсказания скорости проявления перевитой опухоли в мышиной модели РМЖ человека.

Таким образом, можно сделать вывод о том, что индивидуальная предрасположенность к более раннему или позднему проявлению перевитой опухоли может быть выявлена по ряду гематологических и биохимических показателей, измеренных заблаговременно у интактных реципиентов и отражающих основные патофизиологические изменения внутренних органов и систем.