БИОМАРКЕРЫ КРОВИ В ДИАГНОСТИКЕ РАКА ЛЕГКОГО В ЭПОХУ МАШИННОГО ОБУЧЕНИЯ: ПОТЕНЦИАЛ И ОГРАНИЧЕНИЯ ИСПОЛЬЗОВАНИЯ

Жиленкова А.В. 1, Орлова Е.В. 2, Секачева М.И. 1

1 ФГАОУ ВО Первый МГМУ им. И.М. Сеченова Минздрава России (Сеченовский Университет)

2 ФГАОУ ВО Первый МГМУ им. И.М. Сеченова Минздрава России (Сеченовский Университет) (Москва, Российская Федерация)

Жиленкова А.В. - разработка концепции, работа с данными, анализ данных, написание черновика рукописи

Орлова Е.В. - научное руководство, написание рукописи – рецензирование и редактирование

Секачева М.И. - научное руководство, написание рукописи – рецензирование и редактирование

Рак лёгкого остаётся одной из ведущих причин онкологической смертности в мире, при этом большинство случаев диагностируется на поздних стадиях, что обусловливает неблагоприятный прогноз. В связи с этим актуальным направлением исследований является разработка эффективных методов диагностики заболевания. Целью настоящей работы является обобщение и критический анализ современных данных о диагностической эффективности биомаркерной диагностики рака легкого с акцентом на мультимаркерные панели и использование моделей искусственного интеллекта, а также оценка факторов, ограничивающих их клиническое внедрение. Выполнен нарративный обзор публикаций, отобранных в базах PubMed, MEDLINE, Scopus и Web of Science за период с 2010 по 2025 год. Проанализированы более 60 клинических исследований и метаанализов, посвящённых циркулирующей опухолевой ДНК, микроРНК, белковым маркерам, аутоантителам и циркулирующим опухолевым клеткам, а также применению алгоритмов машинного обучения для диагностики рака лёгкого. В список литературы включено 27 источников. Установлено, что использование мультимаркерных панелей, особенно в сочетании с клиническими данными, обеспечивает более высокую диагностическую ценность по сравнению с отдельными биомаркерами. Показано, что применение методов машинного обучения способствует повышению точности диагностики и стратификации риска. В то же время выявлено, что преобладание ретроспективных исследований с внутренней валидацией ограничивает воспроизводимость результатов и их клиническую интерпретацию. Таким образом, анализ циркулирующих биомаркеров крови в сочетании с методами машинного обучения представляет перспективное направление неинвазивной диагностики рака лёгкого, однако его внедрение в клиническую практику и популяционный скрининг требует дальнейшего подтверждения в проспективных многоцентровых исследованиях.

Статья в формате PDF

323 KB

рак легкого

биомаркеры

мультимаркерная панель

диагностика

циркулирующая опухолевая днк

1. Zhou J, Xu Y, Liu J, Feng L, Yu J, Chen D. Global burden of lung cancer in 2022 and projections to 2050: Incidence and mortality estimates from GLOBOCAN. Cancer Epidemiol. 2024 Dec;93:102693. URL: https://www.sciencedirect.com/science/article/pii/S1877782124001723 DOI: 10.1016/j.canep.2024.102693.

2. Состояние онкологической помощи населению России в 2022 году. Под ред. А. Д. Каприна, В. В. Старинского, А. О. Шахзадовой. М.: МНИОИ им. П. А. Герцена − филиал ФГБУ «НМИЦ радиологии» Минздрава России, 2022. илл. 239 с. ISBN: 978-5-85502-283-4.

3. National Lung Screening Trial Research Team; Aberle DR, Adams AM, Berg CD, Black WC, Clapp JD, Fagerstrom RM, Gareen IF, Gatsonis C, Marcus PM, Sicks JD. Reduced lung-cancer mortality with low-dose computed tomographic screening. N Engl J Med. 2011 Aug 4;365(5):395-409. URL: https://www.nejm.org/doi/full/10.1056/NEJMoa1102873. DOI: 10.1056/NEJMoa1102873.

4. Lee HJ, Kim YT, Park PJ, Shin YS, Kang KN, Kim Y, Kim CW. A novel detection method of non-small cell lung cancer using multiplexed bead-based serum biomarker profiling. J Thorac Cardiovasc Surg. 2012 Feb;143(2): 421–427.e3. URL: https://www.sciencedirect.com/science/article/pii/S0022522311011652 DOI: 10.1016/j.jtcvs.2011.10.046.

5. Rabby MS, Islam MM, Kumar S, Maniruzzaman M, Hasan MAM, Tomioka Y, Shin J. Identification of potential biomarkers for lung cancer using integrated bioinformatics and machine learning approaches. PLoS One. 2025 Feb 27;20(2):e0317296. URL: https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0317296 DOI: 10.1371/journal.pone.0317296.

6. Kwon HJ, Park UH, Goh CJ, Park D, Lim YG, Lee IK, Do WJ, Lee KJ, Kim H, Yun SY, Joo J, Min NY, Lee S, Um SW, Lee MS. Enhancing Lung Cancer Classification through Integration of Liquid Biopsy Multi-Omics Data with Machine Learning Techniques. Cancers (Basel). 2023 Sep 14;15(18):4556. URL: https://www.mdpi.com/2072-6694/15/18/4556 DOI: 10.3390/cancers15184556.

7. He J, Wang B, Tao J, Liu Q, Peng M, Xiong S, Li J, Cheng B, Li C, Jiang S, Qiu X, Yang Y, Ye Z, Zeng F, Zhang J, Liu D, Li W, Chen Z, Zeng Q, Fan JB, Liang W. Accurate classification of pulmonary nodules by a combined model of clinical, imaging, and cell-free DNA methylation biomarkers: a model development and external validation study. Lancet Digit Health. 2023 Oct;5(10):e647-e656. URL: https://www.thelancet.com/journals/landig/article/PIIS2589-7500(23)00125-5/fulltext DOI: 10.1016/S2589-7500(23)00125-5.

8. Moding EJ, Shahrokh Esfahani M, Jin C, Hui AB, Nabet BY, Liu Y, Chabon JJ, Binkley MS, Kurtz DM, Hamilton EG, Chaudhuri AA, Liu CL, Li Z, Bonilla RF, Jiang AL, Lau BC, Lopez P, He J, Qiao Y, Xu T, Yao L, Gandhi S, Liao Z, Das M, Ramchandran KJ, Padda SK, Neal JW, Wakelee HA, Gensheimer MF, Loo BW Jr, Li R, Lin SH, Alizadeh AA, Diehn M. Integrating ctDNA Analysis and Radiomics for Dynamic Risk Assessment in Localized Lung Cancer. Cancer Discov. 2025 Aug 4;15(8):1609-1629. URL: https://aacrjournals.org/cancerdiscovery/article-abstract/15/8/1609/763856/Integrating-ctDNA-Analysis-and-Radiomics-for?redirectedFrom=fulltext DOI: 10.1158/2159-8290.CD-24-1704.

9. Kong YW, Ferland-McCollough D, Jackson TJ, Bushell M. microRNAs in cancer management. Lancet Oncol. 2012;13:e249-58. URL: https://www.thelancet.com/journals/lanonc/article/PIIS1470-2045(12)70073-6/fulltext DOI: 10.1016/S1470-2045(12)70073-6.

10. Yanlong Yang, Zaoxiu Hu, Yongchun Zhou, Guang-qiang Zhao, Yu-jie Lei, Guang-jian Li, Shuai Chen, et al. The Clinical Use of Circulating microRNAs as Non-Invasive Diagnostic Biomarkers for Lung Cancers. OncoTarget, 2017. URL: https://www.springermedicine.com/lung-cancer/lung-cancer/the-clinical-significance-of-circulating-micrornas-as-biomarkers/51840950 DOI: 10.18632/oncotarget.21644.

11. Takizawa S, Matsuzaki J, Ochiya T. Circulating microRNAs: Challenges with their use as liquid biopsy biomarkers. Cancer Biomark. 2022;35(1):1-9. URL: https://journals.sagepub.com/doi/full/10.3233/CBM-210223 DOI: 10.3233/CBM-210223.

12. Bi H, Yin L, Fang W, Song S, Wu S, Shen J. Association of CEA, NSE, CYFRA 21-1, SCC-Ag, and ProGRP with Clinicopathological Characteristics and Chemotherapeutic Outcomes of Lung Cancer. Lab Med. 2023 Jul 5;54(4):372-379. URL: https://academic.oup.com/labmed/article/54/4/372/6772479 DOI: 10.1093/labmed/lmac122.

13. Yongchang Yang, Shuai Chang, Na Wang, Pengfei Song, Haijing Wei, and Jie Liu. Clinical Utility of Six Serum Tumor Markers for the Diagnosis of Lung Cancer. iLABMED, 2023;1(2):132-141. URL: https://onlinelibrary.wiley.com/doi/full/10.1002/ila2.23 DOI: 10.1002/ila2.23.

14. H. Yoon, Oh-Ran Kwon, K. Kang, Y. Shin, Hosang Shin, E. Yeon, K. Kwon, et al. Diagnostic Value of Combining Tumor and Inflammatory Markers in Lung Cancer. Journal of Cancer Prevention 2016;21,3:187-193. URL: https://www.jcpjournal.org/journal/view.html?volume=21&number=3&spage=187&vmd=A DOI: 10.15430/JCP.2016.21.3.187.

15. Zhenming Tang, Zhou Ling, Chun-Mei Wang, Yan-bin Wu, and Jin-Liang Kong. Serum Tumor-Associated Autoantibodies as Diagnostic Biomarkers for Lung Cancer: A Systematic Review and Meta-Analysis. PLoS ONE 2017;12,7:e0182117. URL: https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0182117 DOI: 10.1371/journal.pone.0182117.

16. J. Vykoukal, J. Fahrmann, Nikul J. Patel, M. Shimizu, E. Ostrin, J. Dennison, C. Ivan, et al. Contributions of Circulating microRNAs for Early Detection of Lung Cancer. Cancers 2022;14,17 4221. URL: https://www.mdpi.com/2072-6694/14/17/4221 DOI: 10.3390/cancers14174221.

17. Mamdani H, Ahmed S, Armstrong S, Mok T, Jalal SI. Blood-based tumor biomarkers in lung cancer for detection and treatment. Transl Lung Cancer Res. 2017 Dec;6(6):648-660. URL: https://tlcr.amegroups.org/article/view/16017/12981 DOI: 10.21037/tlcr.2017.09.03.

18. Fu Y, Li D, Zhu Y, Yan S, Wang X, Lian Z, Xie Q, He Z. Application Value of CYFRA21-1 Combined with NSE, CEA, and SCC-Ag in Lung Cancer. Clin Lab. 2024 Apr 1;70(4). URL: https://www.clin-lab-publications.com/article/4824 DOI: 10.7754/Clin.Lab.2023.230662.

19. Batool SM, Hsia T, Beecroft A, Lewis B, Ekanayake E, Rosenfeld Y, Escobedo AK, Gamblin AS, Rawal S, Cote RJ, Watson M, Wong DTW, Patel AA, Skog J, Papadopoulos N, Bettegowda C, Castro CM, Lee H, Srivastava S, Carter BS, Balaj L. Extrinsic and intrinsic preanalytical variables affecting liquid biopsy in cancer. Cell Rep Med. 2023 Oct 17;4(10):101196. URL: https://www.cell.com/cell-reports-medicine/fulltext/S2666-3791(23)00363-4?_returnURL=https%3A%2F%2Flinkinghub.elsevier.com%2Fretrieve%2Fpii%2FS2666379123003634%3Fshowall%3Dtrue DOI: 10.1016/j.xcrm.2023.101196.

20. Agrawal L, Engel KB, Greytak SR, Moore HM. Understanding preanalytical variables and their effects on clinical biomarkers of oncology and immunotherapy. Semin Cancer Biol. 2018 Oct;52(Pt 2):26-38. URL: https://www.sciencedirect.com/science/article/abs/pii/S1044579X17302481 DOI: 10.1016/j.semcancer.2017.12.008.

21. Hofman P. Next-Generation Sequencing with Liquid Biopsies from Treatment-Naïve Non-Small Cell Lung Carcinoma Patients. Cancers (Basel). 2021 Apr 23;13(9):2049. URL: https://www.mdpi.com/2072-6694/13/9/2049 DOI: 10.3390/cancers13092049.

22. Casagrande GMS, Silva MO, Reis RM, Leal LF. Liquid Biopsy for Lung Cancer: Up-to-Date and Perspectives for Screening Programs. Int J Mol Sci. 2023 Jan 28;24(3):2505. URL: https://www.mdpi.com/1422-0067/24/3/2505 DOI: 10.3390/ijms24032505.

23. Lucien F, Gustafson D. Standardized reporting of pre-analytical variables and quality control of plasma and serum to enhance rigor and reproducibility in liquid biopsy research. J Liq Biopsy. 2024 Jul 25;6:100163. URL: https://www.journalofliquidbiopsy.com/article/S2950-1954(24)00028-6/fulltext DOI: 10.1016/j.jlb.2024.100163.

24. Weiss G, Schlegel A, Kottwitz D, König T, Tetzner R. Validation of the SHOX2/PTGER4 DNA Methylation Marker Panel for Plasma-Based Discrimination between Patients with Malignant and Nonmalignant Lung Disease. J Thorac Oncol. 2017 Jan;12(1):77-84. URL: https://www.jto.org/article/S1556-0864(16)30842-5/fulltext DOI: 10.1016/j.jtho.2016.08.123.

25. Jin Y, Mu W, Shi Y, Qi Q, Wang W, He Y, Sun X, Yang B, Cui P, Li C, Liu F, Liu Y, Wang G, Zhao J, Zhang Y, Zhang S, Cao C, Sun C, Hong N, Cai S, Tian J, Yang F, Chen K. Development and validation of an integrated system for lung cancer screening and post-screening pulmonary nodules management: a proof-of-concept study (ASCEND-LUNG). EClinicalMedicine. 2024 Aug 3;75:102769. URL: https://www.thelancet.com/journals/eclinm/article/PIIS2589-5370(24)00348-1/fulltext DOI: 10.1016/j.eclinm.2024.102769.

26. Lam TYT, Cheung MFK, Munro YL, Lim KM, Shung D, Sung JJY. Randomized Controlled Trials of Artificial Intelligence in Clinical Practice: Systematic Review. J Med Internet Res. 2022 Aug 25;24(8):e37188. URL: https://www.jmir.org/2022/8/e37188/ DOI: 10.2196/37188.

27. Bi WL, Hosny A, Schabath MB, Giger ML, Birkbak NJ, Mehrtash A, Allison T, Arnaout O, Abbosh C, Dunn IF, Mak RH, Tamimi RM, Tempany CM, Swanton C, Hoffmann U, Schwartz LH, Gillies RJ, Huang RY, Aerts HJWL. Artificial intelligence in cancer imaging: Clinical challenges and applications. CA Cancer J Clin. 2019 Mar;69(2):127-157. URL: https://acsjournals.onlinelibrary.wiley.com/doi/10.3322/caac.21552 DOI: 10.3322/caac.21552.

Введение

Рак легкого является одной из ведущих причин онкологической смертности в мире, что в значительной степени связано с выявляемостью на запущенных стадиях [1; 2]. Традиционные методы визуализации, такие как низкодозовая компьютерная томография, обладают ограниченной специфичностью и характеризуются высокой частотой ложноположительных результатов [3]. В этой связи растет интерес к разработке неинвазивных методов диагностики на основе анализа биомаркеров крови [4]. В последние годы влияние на развитие биомаркерной диагностики рака легкого оказывает внедрение методов искусственного интеллекта, машинного обучения и анализа больших данных [5]. Современные молекулярные исследования генерируют высокоразмерные мультиомные данные (геномные, транскриптомные, протеомные), интерпретация которых затруднительна с использованием традиционных статистических подходов [5; 6]. Алгоритмы машинного обучения позволяют выявлять сложные нелинейные взаимосвязи между молекулярными признаками и клиническими характеристиками, формируя диагностические сигнатуры на основе циркулирующей опухолевой ДНК, микроРНК и белковых панелей. В ряде исследований применение алгоритмов машинного обучения ассоциировано с более высокой дискриминационной способностью тестов по сравнению с использованием отдельных биомаркеров и способствует более точной стратификации пациентов по риску и вероятности ответа на терапию [6-8].

Цель исследования: обобщение и критический анализ современных данных о диагностической эффективности циркулирующих биомаркеров крови при раке лёгкого с акцентом на мультимаркерные панели и модели, основанные на методах машинного обучения, а также оценка их потенциала и ограничений для диагностических целей в реальной клинической практике.

Материалы и методы исследования

Настоящая работа выполнена в формате нарративного обзора литературы, авторы выполнили обобщение современных данных о применении биомаркеров крови в диагностике рака лёгкого и результатов возможностей их интеграции с методами машинного обучения. Поиск публикаций проводился в базах данных PubMed, MEDLINE, Scopus и Web of Science за период с 2010 по 2025 год с использованием комбинаций ключевых слов: lung cancer, blood biomarkers, liquid biopsy, circulating tumor DNA, microRNA, protein markers, machine learning, artificial intelligence, diagnosis, early detection. Авторы включали в работу оригинальные клинические исследования, метаанализы и систематические обзоры, оценивающие диагностическую значимость циркулирующих биомаркеров крови, таких как циркулирующая опухолевая ДНК (цоДНК), микроРНК, белковые маркеры и аутоантитела у пациентов с установленным диагнозом «рак легкого». Авторы исключали экспериментальные исследования на животных и клеточных моделях и работы, посвященные прогнозу и мониторингу терапии. Отобранные публикации анализировались качественно с учётом дизайна исследований, характеристик выборок, применяемых алгоритмов машинного обучения и показателей диагностической ценности (чувствительность, специфичность, AUC ROC).

Результаты исследования и обсуждение

Все рассмотренные авторами исследования были посвящены использованию биомаркеров крови для диагностики рака лёгкого и включали подходы от валидации одиночных биомаркеров до разработки комплексных мультимаркерных панелей. В большинстве работ в качестве биологического материала использовались сыворотка или плазма крови. Дизайн исследований включал как первичные клинические исследования, так и систематические обзоры и метаанализы.

Анализ данных показал, что одиночные маркеры обладают ограниченной диагностической ценностью, особенно на ранних стадиях заболевания. Комбинированные панели позволяют учитывать многокомпонентную природу опухолевого процесса. Оценка диагностической эффективности чаще всего основывается на чувствительности, специфичности и площади под ROC-кривой.

В проанализированных работах часто используются ретроспективные выборки, преимущественно с дизайном «случай – контроль». Подобный подход может влиять на получаемые оценки и в ряде случаев приводить к их завышению. При этом валидация нередко проводится на тех же данных, на которых разрабатывались модели, тогда как проверка на независимых выборках встречается значительно реже. Это важно учитывать при интерпретации результатов.

Дополнительные сложности связаны с неоднородностью исследуемых популяций. В разных работах варьируют стадии заболевания, гистологические подтипы и клинико-демографические характеристики пациентов. Такие различия могут отражаться на уровне циркулирующих биомаркеров и, как следствие, влиять на диагностические показатели, что затрудняет сопоставление результатов между исследованиями.

В ряде публикаций отмечается, что наибольшая клиническая значимость биомаркеров проявляется при их использовании в группах повышенного риска, что имеет особое значение для задач раннего выявления рака легкого. Вместе с тем остается нерешенной проблема стандартизации преданалитического этапа. Условия забора, обработки и хранения биоматериала нередко различаются между исследованиями, что может приводить к существенной вариабельности результатов даже при использовании сходных лабораторных методов.

С учётом указанных ограничений полученные данные требуют осторожной интерпретации. Дальнейшее развитие данного направления, по-видимому, связано с унификацией методологических подходов и проведением проспективных многоцентровых исследований с внешней валидацией.

Различные классы биомаркеров

Циркулирующие микроРНК обнаруживаются в крови пациентов с онкологическими заболеваниями и сохраняют стабильность в условиях анализа, что обусловило интерес к их использованию в диагностике [9]. При этом наибольшая информативность, по данным ряда исследований, достигается при применении панелей микроРНК, тогда как отдельные маркеры демонстрируют менее устойчивые диагностические показатели. В метаанализе Yanlong Yang и соавт. (2017) на основании данных 134 исследований была показана объединённая чувствительность 0,83 (95% ДИ: 0,80–0,85), специфичность 0,84 (95% ДИ: 0,82–0,86) и AUC 0,90 (95% ДИ: 0,88–0,93). Комбинированные панели микроРНК характеризовались более высокой диагностической ценностью по сравнению с одиночными микроРНК: чувствительность составила 0,87 против 0,79, специфичность 0,87 против 0,78, а значения AUC 0,94 против 0,85, соответственно [10]. Ограничениями метода являются отсутствие единых протоколов выделения и стабилизации микроРНК, а также влияние преаналитических факторов, таких как гемолиз, на достоверность результатов [11].

Классические белковые маркеры, такие как РЭА, NSE, CYFRA21-1 и ProGRP, были широко изучены в научных исследованиях. Их диагностическая ценность варьирует в зависимости от гистологического подтипа опухоли. Так, Huijuan Bi и соавт. (2023) показали, что РЭА более информативен при аденокарциноме легкого, тогда как NSE и ProGRP более эффективен при мелкоклеточном раке легкого [12]. Комбинации белковых маркеров позволяют повысить суммарную чувствительность, однако часто это сопровождается снижением специфичности. Так, комбинированное применение ProGRP, CEA, NSE, CYFRA21-1, CA19-9, SCCA продемонстрировало чувствительность 70,6% для плоскоклеточного рака, 77,4% для аденокарциномы и 80% для мелкоклеточного рака легкого [13].

H. Yoon и соавт. (2016) оценили комбинацию опухолевых маркеров (HE4, CEA) с воспалительными и метаболическими показателями (RANTES, ApoA2, TTR, sVCAM-1), продемонстрировав высокую диагностическую эффективность. Так, значения AUC составили 0,986 в обучающей выборке и 0,988 в валидационной выборке, при чувствительности 93,33% и специфичности 94%. При этом показатели AUC для отдельных биомаркеров варьировали от 0,552 для sVCAM-1 до 0,867 для ApoA2 [14].

Аутоантитела против опухолевых антигенов характеризуются высокой специфичностью, но низкой чувствительностью, что ограничивает их применение в качестве скринингового инструмента. Тем не менее они могут быть полезны на этапе дифференциальной диагностики или подтверждения диагноза [15].

В ряде исследований комбинированные панели демонстрируют улучшение диагностических показателей при сочетании различных типов биомаркеров. Так, J. Vykoukal и соавт. (2022) провели оценку 30 циркулирующих микроРНК и установили, что пять из них (miR-320a-3p, miR-210-3p, miR-92a-3p, miR-21-5p и miR-140-3p) были статистически значимо повышены у пациентов с раком лёгкого (p < 0,05). При объединении трёх микроРНК с панелью из четырёх белковых маркеров (Pro-SFTPB, CA125, CEA, CYFRA21-1) чувствительность при уровне специфичности 95% увеличивалась на 19,1% (95% ДИ: 0,0–28,6; p = 0,006) по сравнению с использованием только белковой панели, при этом значение площади под ROC-кривой (AUC) достигло 0,81 [16].

Ограничения и преимущества биомаркерной диагностики

Большинство исследований в области изучения биомаркеров в качестве диагностических инструментов при раке легкого характеризуются ограниченным размером выборок и отсутствием внешней валидации, что препятствует внедрению данных подходов в клиническую практику. Белковые биомаркеры могут выявляться не только при раке лёгкого, но и при других заболеваниях, а также у здоровых лиц, что ограничивает их специфичность [17; 18]. Анализ опухоль-ассоциированных аутоантител, выполненный Zhenming Tang и соавт. (2017), также выявил ряд ограничений, включая анализ работ, опубликованных только на английском и китайском языках, что может приводить к публикационному смещению. Кроме того, значительная гетерогенность составов панелей аутоантител и методов их детекции между исследованиями создаёт серьёзные трудности для стандартизации данных подходов [15].

Другим критическим фактором, влияющим на достоверность результатов анализа биомаркеров, является отсутствие унифицированных протоколов преданалитического этапа. Вариабельность условий забора крови, используемых пробирок, объема образца, времени и условий хранения приводит к деградации биоматериала и снижению воспроизводимости данных [19; 20].

Высокая стоимость технологий остаётся серьёзным ограничением доступности биомаркеров крови. Методы, основанные на секвенировании нового поколения, требуют значительных финансовых вложений, что делает их применение затруднительным для региональных клиник и систем здравоохранения с ограниченными ресурсами [21]. Инфраструктурные барьеры включают дефицит специализированных лабораторий, нехватку обученного персонала и сложность организации многоцентровых исследований, необходимых для клинической валидации биомаркеров. В результате этого внедрение жидкостной биопсии носит фрагментарный характер и географически неравномерно [22].

Преодоление существующих ограничений требует комплексного и скоординированного подхода. В области стандартизации приоритетными являются разработка и внедрение унифицированных протоколов преданалитического и аналитического этапов, а также межлабораторная гармонизация методик. Технический прогресс должен сопровождаться автоматизацией процессов, развитием высокочувствительных методов детекции и интеграцией нескольких биомаркеров для повышения диагностической точности. Экономическая устойчивость может быть достигнута за счёт оптимизации технологий, масштабирования производства и разработки моделей возмещения затрат [22; 23].

Следует отметить, что большинство рассмотренных авторами исследований использовали внутреннюю перекрестную валидацию или разделение выборки на обучающую и тестовую. Однако внешняя валидация на независимых когортах выполнялась редко, что создает риск переобучения моделей.

При этом стоит отметить, что результаты внешней валидации зависят от клинического контекста. Было показано, что набор контрольной группы из здоровых добровольцев демонстрирует более высокие показатели AUC по сравнению с популяцией пациентов с наличием доброкачественных заболеваний легких. Так, в работе Schlegel Anne и соавт. (2016) в валидационном исследовании панели маркеров метилирования ДНК SHOX2/PTGER4 AUC панели составил 0.88 по сравнению с AUC 0.91-0.98 в трех ранее проведенных исследованиях дизайна «случай - контроль» [24].

Перспективы биомаркерной диагностики в эпоху машинного обучения и больших данных

Интерес к использованию методов машинного обучения в диагностике онкологических заболеваний в последние годы заметно возрос, прежде всего из-за увеличения объёма доступных биомедицинских данных. Это напрямую связано с развитием «омиксных» технологий (геномики, транскриптомики, протеомики и метаболомики), при применении которых формируются высокоразмерные наборы данных, плохо поддающиеся анализу в рамках классических статистических подходов.

В отличие от традиционного анализа отдельных биомаркеров, в данном случае речь идёт о построении комплексных диагностических моделей. Например, показано, что при использовании данных циркулирующей опухолевой ДНК в сочетании с другими молекулярными маркерами возможно повышение точности ранней диагностики рака лёгкого, в том числе за счёт снижения числа ложноположительных результатов [6]. При этом степень улучшения показателей существенно варьирует между исследованиями.

Отдельное направление связано с попытками объединения разнородных типов данных. В ряде работ используются модели, интегрирующие результаты жидкостной биопсии, клинические характеристики пациентов и данные лучевой диагностики (радиомика). Такие подходы рассматриваются не только в контексте диагностики, но и для решения прогностических задач - в частности, оценки ответа на терапию и вероятности рецидива [7; 8].

Подходы, основанные на анализе больших популяционных выборок, также использовались для разработки персонализированных моделей риска. Например, в исследовании ASCEND-LUNG Jin Y. и соавт. (2024) была предложена модель, сочетающая клинические и радиологические данные для задач скрининга рака легкого и мониторинга легочных узлов, однако ее дальнейшая валидация в независимых когортах остаётся необходимой [25].

Широкое использование методов искусственного интеллекта не устраняет существующих методологических проблем. Среди них - различия в подходах к обработке биологических данных, несогласованность лабораторных протоколов и ограниченная воспроизводимость алгоритмов при их применении в разных клиниках, риск переобучения [26]. Переход к клиническому применению таких алгоритмов требует дополнительной проверки их эффективности в рамках проспективных исследований на больших выборках пациентов. Наряду с этим пока не сформированы единые подходы к регулированию и сертификации медицинских систем, использующих методы искусственного интеллекта [27].

Заключение

Критический анализ современной литературы о роли биомаркеров в диагностике рака легкого показывает, что циркулирующие биомаркеры крови могут рассматриваться как перспективный инструмент неинвазивной диагностики рака легкого. В ряде исследований показано, что более высокие диагностические показатели достигаются при использовании мультимаркерных панелей, включающих микроРНК, циркулирующую опухолевую ДНК, белковые маркеры и аутоантитела. Дополнительный эффект наблюдается при их совместном анализе с клинико-демографическими характеристиками пациентов с применением методов машинного обучения.

Вместе с тем интерпретация этих данных остаётся неоднозначной. Существенная часть результатов получена в ретроспективных исследованиях, чаще всего с дизайном «случай – контроль» и использованием внутренней валидации. Это может влиять на воспроизводимость и приводить к завышенной оценке диагностической эффективности. Дополнительные ограничения связаны с отсутствием единых подходов к преаналитическому этапу, а также с различиями в используемых пороговых значениях и алгоритмах анализа, что затрудняет сопоставление результатов между исследованиями.

Использование биомаркеров крови в сочетании с методами машинного обучения представляет интерес с точки зрения диагностики и стратификации риска. Однако данных, подтверждающих эффективность такого подхода в популяционном скрининге рака лёгкого, в настоящее время недостаточно. Для уточнения его клинической значимости необходимы проспективные многоцентровые исследования с внешней валидацией моделей и более согласованными лабораторными и аналитическими процедурами.

Конфликт интересов

Авторы заявляют об отсутствии конфликта интересов.

Финансирование

Авторы заявляют об отсутствии внешнего финансирования.

Библиографическая ссылка

Жиленкова А.В., Орлова Е.В., Секачева М.И. БИОМАРКЕРЫ КРОВИ В ДИАГНОСТИКЕ РАКА ЛЕГКОГО В ЭПОХУ МАШИННОГО ОБУЧЕНИЯ: ПОТЕНЦИАЛ И ОГРАНИЧЕНИЯ ИСПОЛЬЗОВАНИЯ // Современные проблемы науки и образования. 2026. № 5. ;
URL: https://science-education.ru/ru/article/view?id=34595 (дата обращения: 29.07.2026).
DOI: https://doi.org/10.17513/spno.34595

Сетевое научное издание
Современные проблемы науки и образования

ISSN 2070-7428

"Перечень" ВАК

ИФ РИНЦ = 0,936