Scientific journal
Modern problems of science and education
ISSN 2070-7428
"Перечень" ВАК
ИФ РИНЦ = 0,936

DISCRIMINANT ANALYSIS OF MORPHOFUNCTIONAL PARAMETERS FOR ESOPHAGEAL CANCER RISK PREDICTION

Startsev S.S. 1, 2, Gorbunova E.A. 3, 4, Zukov R.A. 3, 4, Medvedeva L.V. 5
1 Federal State Budgetary Educational Institution of Higher Education "Pacific State Medical University"
2 State Budgetary Healthcare Institution "Sakhalin Regional Clinical Oncology Dispensary"
3 Federal State Budgetary Educational Institution of Higher Education "Prof. V. F. Voino-Yasenetsky Krasnoyarsk State Medical University"
4 Regional State Budgetary Healthcare Institution "A. I. Kryzhanovsky Krasnoyarsk Regional Clinical Oncology Dispensary"
5 Federal State Autonomous Educational Institution of Higher Education "Immanuel Kant Baltic Federal University"
Despite the improvement of diagnostic approaches, early detection of esophageal cancer remains a pressing challenge, resulting in persistently high one-year mortality rates. Pronounced sex-based differences in the epidemiology of the disease, persisting irrespective of the histological tumor type, necessitate the development of sex-differentiated systems for individual risk assessment. The aim of the present study was to develop discriminant models for predicting esophageal cancer in men and women based on morphofunctional predictors. The study involved patients with newly diagnosed esophageal cancer and healthy individuals constituting the control group. All participants underwent anthropometry and bioimpedance analysis of body composition. Sex-specific sets of predictors were identified using stepwise discriminant analysis. In males, the following parameters demonstrated classificatory value: height, transverse chest diameter, and waist circumference. In females, the set of predictors included the sex dimorphism index and fat mass. The percentage of active cell mass was a predictor for both gender groups. Linear classification equations were constructed based on the selected variables. The accuracy of the male model reached 85.7%, and that of the female model amounted to 87.2%; the predictive quality assessed by AUC was rated as very good and excellent, respectively. The parameters contributing most substantially to group discrimination were revealed. The derived discriminant functions can serve as an auxiliary tool for esophageal cancer risk stratification during preventive examinations of the adult population.
anthropometry
bioimpedance analysis (bia)
constitutional parameters
esophageal cancer
predictors
discriminant analysis
roc analysis

Введение

Рак пищевода является одной из ведущих причин онкологической смертности. По последним оценкам Международного агентства по изучению рака, в 2022 году в мире было зарегистрировано 511 054 новых случая заболевания раком пищевода, а число умерших достигло 445 391 человек. В структуре мировой онкологической заболеваемости рак пищевода занимает 11-е место, в структуре смертности - 7-е место. Глобальные коэффициенты, стандартизированные по возрасту, демонстрируют следующее соотношение: заболеваемость - 5,0 на 100 тыс. населения, смертность - 4,3 на 100 тыс. населения; крайне высокая летальность - из пяти заболевших раком пищевода в течение года умирает более четырех человек [1]. В Российской Федерации в 2024 году было зарегистрировано 7258 новых случаев заболевания раком пищевода, при этом доля пациентов с III–IV стадиями составила 61,0%. Показатель одногодичной летальности, несмотря на устойчивую тенденцию к снижению, удерживается на уровне 50,9%, что количественно отражает ограниченные возможности существующих подходов к выявлению опухоли на ранних стадиях [2].

Эпидемиологической особенностью рака пищевода является выраженный половой диморфизм: соотношение показателей заболеваемости мужчин и женщин достигает 2,9:1 в сторону мужской популяции. Это подтверждается соотношением стандартизированных по возрасту показателей заболеваемости: 7,6 на 100 тыс. мужского населения против 2,6 на 100 тыс. женского населения [1].

Этиология рака пищевода демонстрирует выраженную гистологическую гетерогенность, определяющую специфичность факторов риска для двух основных морфологических типов [3]. Плоскоклеточный рак, преобладающий в странах Азии, Южной Америки и Юго-Восточной Африки, этиологически связан с воздействием табачного дыма, этанола, повторяющимися термическими травмами слизистой оболочки горячими напитками и алиментарным дефицитом свежих плодоовощных продуктов [4; 5]. Аденокарцинома пищевода, напротив, доминирует в экономически развитых странах, и ее основными факторами риска признаны гастроэзофагеальная рефлюксная болезнь, избыточная масса тела с абдоминальным типом распределения жировой ткани и пищевод Барретта [6; 7].

В крупном проспективном исследовании EPIC с участием 346 554 человек из десяти европейских стран и медианой наблюдения 8,9 года была установлена независимая связь антропометрических показателей с риском аденокарциномы пищевода. Наиболее сильным предиктором оказалась окружность талии [8]. Позднее, при расширенном анализе когорты с 14-летним периодом наблюдения и взаимной корректировкой показателей, было подтверждено, что именно абдоминальный тип распределения жировой ткани, а не общая масса тела, выступает ведущим антропометрическим фактором риска аденокарциномы пищевода, причем у женщин эта связь проявлялась особенно отчетливо [9].

При этом выраженный половой диморфизм в заболеваемости прослеживается вне зависимости от гистологического варианта опухоли, что указывает на потенциальную роль конституциональных особенностей и компонентного состава тела в ее развитии [10; 11]. Перспективным направлением для количественной оценки данных характеристик является биоимпедансный анализ (БИА) - неинвазивный метод количественной оценки компонентного состава тела, основанный на измерении электрического сопротивления биологических сред [12; 13].

Несмотря на подтвержденную информативность БИА, модели, интегрирующие антропометрические и биоимпедансометрические предикторы для стратификации риска рака пищевода с учетом полового фактора, остаются малоизученной областью [14].

Эти данные актуализируют поиск неинвазивных инструментов скрининга и подчеркивают важность раздельного подхода к моделированию рисков для мужской и женской популяций [15].

Цель исследования - построить дискриминантные модели прогнозирования рака пищевода для мужчин и женщин, основанные на морфофункциональных предикторах.

Материалы и методы исследования. Проведено поперечное (одномоментное) исследование, выполненное на клинических базах КГБУЗ «Красноярский краевой клинический онкологический диспансер им. А. И. Крыжановского» (г. Красноярск) и ГБУЗ «Сахалинский областной клинический онкологический диспансер» (г. Южно-Сахалинск) в 2023-2024 гг. На проведение работы получено разрешение Локального этического комитета КГБУЗ «Красноярский краевой клинический онкологический диспансер им. А. И. Крыжановского» (выписка № 33 из протокола заседания № 58 от 17 мая 2023 г.). Все участники исследования заполняли информированное добровольное согласие.

Критерии включения в исследование:

1. Наличие впервые выявленного рака пищевода без предшествующего противоопухолевого лечения.

2. Согласие пациента на участие в исследовании.

3. Возраст от 18 до 86 лет включительно.

Критерии исключения из исследования:

1. Нежелание пациента принимать участие в исследовании.

2. Состояние пациента по шкале ECOG ≥ 2.

3. Сопутствующие заболевания в стадии декомпенсации.

4. Наличие кардиостимулятора (противопоказание к биоимпедансометрии).

5. Наличие беременности на момент включения в исследование.

В исследуемую группу вошли 110 пациентов с впервые диагностированной карциномой пищевода - 87 мужчин и 23 женщины, возрастной диапазон 35–86 лет. Всем участникам выполнена комплексная оценка физического статуса, включавшая антропометрию и биоимпедансный анализ состава тела.

Группу сравнения составили 488 соматически здоровых жителей Красноярского края (221 мужчина и 267 женщин), прошедших конституциональное обследование в сопоставимом возрастном диапазоне [16]. Основная и контрольная группы были сопоставимы по возрасту и относились к европеоидной расе, что исключает влияние расовой принадлежности на изучаемые морфофункциональные параметры.

Рабочая гипотеза состояла в предположении, что конституциональные особенности, регистрируемые методами антропометрии и биоимпедансного анализа, обладают прогностической значимостью в отношении риска рака пищевода, а их выявление открывает возможность для персонификации диспансерного наблюдения и формирования групп повышенного риска.

Всем пациентам была установлена стадия заболевания согласно 8 изданию TNM (классификация злокачественных опухолей, 2017 г.): I стадия рака пищевода была диагностирована у 9 пациентов (7,9%), II стадия - у 34 пациентов (31,4%), III стадия - у 30 пациентов (27,4%), IV стадия - у 37 пациентов (33,3%).

По результатам гистологического исследования плоскоклеточный рак пищевода был выявлен у 100 пациентов (90,6%), аденокарцинома пищевода подтверждена у 10 больных (9,4%).

Для минимизации возможного влияния регионального фактора на результаты исследования был выполнен сравнительный анализ морфофункциональных показателей между красноярскими и сахалинскими пациентами, который не выявил статистически значимых межгрупповых различий ни по одному из включенных в модели предикторов (p > 0,05). Полученные данные позволяют рассматривать объединенную группу больных как однородную по изучаемым характеристикам и считать региональный фактор маловероятным смешивающим обстоятельством в построенных дискриминантных моделях.

Антропометрический блок обследования охватывал регистрацию продольных (длина тела), поперечных (диаметры плечевого пояса, грудной клетки, таза) и обхватных (талия, бедра) размеров, а также массы тела с использованием стандартного инструментария. Компонентный состав тела оценивали посредством биоимпедансного анализатора ABC01-036, который позволил определить следующие показатели: жировая масса (кг), безжировая масса (кг), активная клеточная масса (кг и % от общей), скелетно-мышечная масса (кг и %), общий основной обмен (ккал/сут.), удельный основной обмен (ккал/м²/сут.), общая вода организма (кг), объем внеклеточной жидкости (кг) и фазовый угол (градусы).

Поиск морфофункциональных параметров, значимо разграничивающих выборки больных раком пищевода и здоровых, осуществлялся посредством пошагового включения переменных в дискриминантную модель. Согласованность матриц ковариаций в сопоставляемых когортах проверяли посредством расчета многомерного критерия Бокса. Способность функции к достоверному разделению классов подтверждали с помощью коэффициента лямбда Уилкса.

Оценивая значимость отдельных параметров в итоговой дифференцировке, основывались на величинах стандартизованных коэффициентов и анализе корреляций, представленных в структурной матрице. В качестве практического инструмента идентификации рассчитывали линейные классификационные уравнения Фишера, представленные математическими выражениями, в которых каждая переменная умножается на собственный весовой коэффициент и суммируется с константой. Итоговое заключение выносилось в пользу того класса (наличие либо отсутствие рака пищевода), для которого численное значение функции оказывалось наибольшим.

Прогностическое качество моделей верифицировали методом ROC-анализа с вычислением площади под кривой (AUC), чувствительности и специфичности. Оптимальное пороговое значение определяли по координатам ROC-кривой как точку, обеспечивающую наилучший баланс между чувствительностью и специфичностью.

В настоящем исследовании для бинарной классификации использовался стандартный порог апостериорной вероятности, равный 0,5: пациент относится к той группе, для которой предсказанная вероятность превышает 0,5. При данном пороге получены указанные показатели чувствительности и специфичности. Смещение порога в сторону меньших значений позволит повысить чувствительность (что целесообразно для скрининга), в сторону больших - специфичность. Оптимизация порога для конкретных клинических сценариев является предметом дальнейших исследований.

Результаты исследования и их обсуждение. Применение процедуры пошагового включения предикторов в дискриминантный анализ на материале мужской подгруппы позволило из исходного массива морфофункциональных характеристик выделить четыре показателя, вносящих наибольший вклад в разделение наблюдений по статусу заболевания. Указанные переменные продемонстрировали статистически значимую связь с канонической дискриминантной функцией и были признаны ключевыми классификаторами. Количественные параметры полученной модели, а именно нормированные коэффициенты и величины канонических корреляций для каждого предиктора, систематизированы в таблице1.

Таблица 1

Нормированные коэффициенты дискриминантной функции и корреляции предикторов с канонической переменной у мужчин

Предиктор

Коэффициент функции

Структурная матрица

Рост, см

-0,347

-0,103

Диаметр грудной клетки (поперечный размер), см

0,248

0,477

Окружность талии, см

0,651

0,537

Доля активной клеточной массы, %

0,857

0,579

Примечание. Составлено авторами по результатам исследования.

Коэффициент канонической корреляции достиг величины 0,662, что соответствует 43,8% объясненной вариации групповой принадлежности. Достоверность функции подтверждена значением лямбды Уилкса, равным 0,562 при χ² = 175,285, что подтверждает достоверность межгрупповых различий (p<0,001). Среди включенных в модель признаков доминирующую роль в разделении классов играли доля активной клеточной массы и обхват талии. Ковариационные матрицы сопоставляемых групп статистически значимо различались по многомерному тесту Бокса (p <0,001). Таким образом, полученная модель обладает удовлетворительной дискриминирующей способностью и может использоваться в качестве инструмента классификации. Весовые коэффициенты отобранных предикторов, на основе которых вычисляется групповая принадлежность мужчин, систематизированы в таблице 2. Для получения количественной оценки риска в формулы помещают фактические значения соответствующих параметров конкретного пациента, после чего определяют, какая из двух величин (D₁ или D₂) оказывается больше. Дальнейшее сопоставление итогового значения с порогом отсечения, установленным по ROC-кривой, позволяет принять решение о необходимости дополнительного эндоскопического обследования.

Таблица 2

Коэффициенты классификационных уравнений для разделения мужчин по признаку отсутствия/наличия рака пищевода на основе морфофункциональных характеристик

Предиктор

Отсутствие рака пищевода

Наличие рака пищевода

Рост, см

3,609

3,714

Диаметр грудной клетки (поперечный размер), см

3,968

3,794

Окружность талии, см

0,241

0,131

Доля активной клеточной массы, %

2,832

2,420

Константа

-461,179

-441,522

Примечание. Составлено авторами по результатам исследования.

Использование индивидуальных значений указанных параметров в следующих выражениях позволяет вычислить две величины, соответствующие вероятной групповой принадлежности. Итоговое решение принимается в пользу того класса, для которого результат расчета оказался выше.

Линейные дискриминантные функции, ассоциированные с отсутствием/наличием злокачественного новообразования пищевода у мужчин:

 

 

 

где D₁ - линейная дискриминантная функция, ассоциированная с отсутствием рака пищевода;

D₂ - линейная дискриминантная функция, ассоциированная с наличием рака пищевода;

x₁ - рост, см;

x₂ - диаметр грудной клетки (поперечный размер), см;

x₃ - окружность талии, см;

x₄ - доля активной клеточной массы, %.

На основании полученных дискриминантных функций была произведена итоговая классификация наблюдений. Специфичность модели (доля случаев отсутствия рака пищевода) составила 89,6%, чувствительность (идентификация рака) - 75,9%. Совокупная доля правильных ответов - 85,7%. Прогностическую ценность полученного решающего правила определяли методом ROC-анализа. Величина площади под ROC-кривой у мужчин достигла 0,896 ± 0,022 (95% доверительный интервал: 0,853–0,940; p<0,001). Согласно принятым экспертным градациям, такое значение AUC классифицируется как свидетельство очень хорошей разделительной способности модели в задаче выявления лиц с высокой вероятностью рака пищевода. Иными словами, построенный классификатор уверенно дифференцирует здоровых мужчин и пациентов с верифицированной карциномой, опираясь исключительно на антропометрические и биоимпедансометрические данные. Полученный результат дает основания рассматривать модель как пригодную для этапа предварительного скрининга.

На следующем этапе работы дискриминантный анализ был применен к женской выборке. Процедура пошагового отбора завершилась включением в итоговую модель трех морфофункциональных параметров, продемонстрировавших максимальную информативность для бинарной классификации (наличие либо отсутствие злокачественного новообразования пищевода). Значения коэффициентов и структурной матрицы для женской когорты обобщены в таблице 3.

Таблица 3

Нормированные коэффициенты дискриминантной функции и корреляции предикторов с канонической переменной у женщин

Предиктор

Коэффициент функции

Структурная матрица

Индекс полового диморфизма

-0,539

-0,390

Жировая масса, кг

0,724

0,219

Доля активной клеточной массы, %

0,886

0,713

Примечание. Составлено авторами по результатам исследования.

Значение канонической корреляции для женской модели достигло 0,480, что позволило учесть 23,0% вариативности зависимой переменной. Статистическая достоверность функции подтверждена критерием лямбда Уилкса на уровне 0,770 (χ² = 74,992; p < 0,001). Приоритетными предикторами, обеспечившими максимальный вклад в дифференцировку групп, явились процент активной клеточной массы и абсолютная жировая масса. Проверка однородности ковариационных матриц с применением М-теста Бокса выявила достоверные межгрупповые различия (p<0,001).

Весовые коэффициенты отобранных предикторов, позволяющие рассчитать вероятность принадлежности женщины к группе с неоплазией пищевода или без неё, приведены в таблице 4. Каждому параметру соответствует числовой множитель в уравнении для двух исходов, что дает возможность формализовать процедуру принятия диагностического решения.

Таблица 4

Коэффициенты классификационных уравнений для разделения женщин по признаку отсутствия/наличия рака пищевода на основе морфофункциональных характеристик

Предиктор

Отсутствие рака пищевода

Наличие рака пищевода

Индекс полового диморфизма

0,957

1,082

Жировая масса, кг

0,267

0,146

Доля активной клеточной массы, %

2,118

1,809

Константа

-98,053

-87,651

Примечание. Составлено авторами по результатам исследования.

Подстановка индивидуальных значений предикторов в приведенные ниже выражения дает две количественные оценки, из которых выбирается наибольшая. Линейные дискриминантные функции, ассоциированные с отсутствием и наличием рака пищевода, записываются в следующем виде:

где D₁ - линейная дискриминантная функция, ассоциированная с отсутствием рака пищевода;

D₂ - линейная дискриминантная функция, ассоциированная с наличием рака пищевода;

x₁ - индекс полового диморфизма;

x₂ - жировая масса, кг;

x₃ - доля активной клеточной массы, %.

Полученная модель характеризуется точностью предсказания отсутствия рака пищевода, соответствующей 87,3%. Доля пациенток с верифицированной опухолью, корректно идентифицированных моделью, достигла 87,0%. Модель продемонстрировала общую прогностическую точность на уровне 87,2%.

С целью комплексной проверки прогностических характеристик женской модели был применен метод ROC-кривых. Площадь под ROC-кривой (AUC) достигла 0,922 ± 0,022 (95% доверительный интервал: 0,879–0,964; p<0,001), что превышает соответствующую величину, зафиксированную для мужской когорты. Данный результат соответствует категории «отличное качество» классификатора и указывает на более высокую разделительную способность модели именно в женской популяции.

Для оценки практической применимости моделей были рассчитаны прогностические ценности положительного и отрицательного результатов (PPV и NPV). В мужской подгруппе PPV составил 74,1%, NPV - 90,4%. Это означает, что при положительном заключении модели вероятность наличия рака пищевода составляет около 74%, а при отрицательном - вероятность отсутствия заболевания превышает 90%.

В женской подгруппе PPV оказался ниже (37,1%) при исключительно высоком NPV (98,8%). Данный дисбаланс объясняется низкой распространенностью рака пищевода среди женщин в исследуемой выборке (7,9%), что является типичной ситуацией для скрининговых инструментов: даже при высокой чувствительности и специфичности PPV снижается при малой доле заболевания в популяции. Высокий NPV женской модели (98,8%) позволяет с большой уверенностью исключать заболевание, что соответствует задаче первичного скрининга - надежно идентифицировать лиц, не нуждающихся в дополнительном обследовании.

Установлено, что женская модель демонстрирует лучшую прогностическую эффективность, несмотря на меньшее число включенных предикторов и более низкое значение канонической корреляции по сравнению с мужской. Данный феномен может объясняться несколькими факторами. Структура взаимосвязей между отобранными у женщин показателями, вероятно, оказалась более благоприятной для итоговой классификации, поскольку показатель AUC зависит не только от силы связи каждого отдельного предиктора с исходом, но и от характера их корреляции друг с другом. Кроме того, включенные в женскую модель параметры, отражающие компонентный состав тела и половой диморфизм, могут обладать большей специфичностью в отношении рака пищевода именно в женской популяции, что и обеспечило более высокую точность классификации.

Процентное содержание активной клеточной массы оказалось единственной переменной, выделенной дискриминантным анализом в группах обоего пола. В отличие от таких параметров, как рост, поперечный диаметр грудной клетки или окружность талии, которые вошли исключительно в мужскую модель, а также индекса полового диморфизма и жировой массы, специфичных только для женской выборки, данный биоимпедансометрический показатель продемонстрировал устойчивую связь с наличием злокачественного новообразования пищевода вне зависимости от пола. Необходимо отметить методологическое ограничение, связанное с применением линейного дискриминантного анализа. М-тест Бокса оказался статистически значимым (p < 0,001) как в мужской, так и в женской подгруппах, что формально указывает на неоднородность ковариационных матриц и нарушение одной из ключевых предпосылок проведения линейного дискриминантного анализа. По данным ряда исследований доказано, что линейный дискриминантный анализ демонстрирует достаточную робастность к умеренным отклонениям от предположения о равенстве ковариационных матриц, особенно в задачах, где приоритетом является точность бинарной классификации, а не проверка статистических гипотез [17; 18]. Итоговая точность моделей, подтвержденная ROC-анализом (AUC 0,896 для мужчин и 0,922 для женщин), косвенно свидетельствует о том, что нарушение данной предпосылки не привело к существенной деградации классификатора. Подобная универсальность позволяет интерпретировать долю активной клеточной массы как интегральный маркер неблагоприятных метаболических сдвигов, сопутствующих опухолевому процессу. Его редукция, регистрируемая у пациентов обоего пола, по всей видимости, отражает системные нарушения клеточного метаболизма, характерные для рака пищевода. С практической точки зрения, высокая информативность этого параметра дает основание рекомендовать его в качестве обязательного компонента при разработке универсальных скрининговых инструментов, ориентированных на оценку индивидуального риска рака пищевода у взрослого населения. Полученные модели требуют внешней валидации и не могут использоваться как самостоятельное основание для клинического решения о направлении на эндоскопическое обследование.

Заключение

Таким образом, проведенный анализ выявил половые различия в наборе морфофункциональных параметров, обладающих классификационной значимостью. У мужчин наиболее информативными предикторами оказались длина тела, поперечный диаметр грудной клетки, обхват талии. У женщин дифференцирующая роль принадлежала индексу полового диморфизма, жировой массе. Доля активной клеточной массы явилась общим классификационным признаком для мужской и женской выборок. Построенные на основе указанных показателей дискриминантные модели обеспечили общую точность распознавания 85,7% в мужской когорте и 87,2% в женской. Полученные результаты дают основание рассматривать разработанный алгоритм как вспомогательный неинвазивный инструмент, пригодный для предварительного выявления лиц с повышенной вероятностью рака пищевода на этапе скрининговых осмотров и диспансеризации.


Conflict of interest
The authors declare that there is no conflict of interest.

Financing
The research was performed without external funding.

Библиографическая ссылка

Старцев С.С., Горбунова Е.А., Зуков Р.А., Медведева Л.В. ДИСКРИМИНАНТНЫЙ АНАЛИЗ МОРФОФУНКЦИОНАЛЬНЫХ ПАРАМЕТРОВ В ПРОГНОЗИРОВАНИИ РИСКА РАЗВИТИЯ РАКА ПИЩЕВОДА // Современные проблемы науки и образования. 2026. № 5. ;
URL: https://science-education.ru/en/article/view?id=34629 (дата обращения: 14.06.2026).
DOI: https://doi.org/10.17513/spno.34629