Введение
В 2022 году, согласно статистическим данным, во всем мире было зарегистрировано 19,96 миллиона новых случаев рака и 9,74 миллиона случаев смерти от этого заболевания. Среди различных видов рака злокачественные новообразования желудочно-кишечного тракта (ЖКТ) занимают одно из ведущих мест. По некоторым оценкам, около 3,4 миллиона новых случаев были связаны с раком пищевода, желудка, тонкой и толстой кишки [1]. Высокая частота выявления злокачественных опухолей органов ЖКТ объясняется улучшением доступности эндоскопических методов исследования, позволяющих осуществлять забор биопсийного материала для последующего гистологического анализа. Однако в условиях постоянного роста онкологической заболеваемости, разнообразия опухолей и нехватки врачей-патологоанатомов необходимо искать новые способы совершенствования патолого-анатомической службы. В связи с этим кажется перспективной разработка алгоритмов на основе искусственного интеллекта (ИИ), способных оказать значительную помощь врачам в диагностике [2].
В 2024 году Нобелевский комитет оценил значительный вклад ИИ в развитие науки и присвоил премию сразу в двух дисциплинах: физике и химии, что свидетельствует о признании этого направления в научной среде. Развитие цифровой патологии увеличило интерес к использованию ИИ в диагностике опухолей. Для этого применяются методы машинного обучения, включающие компьютерные алгоритмы, способные реализовывать полученные знания, имитируя человеческое мнение [3]. Алгоритмы на основе глубокого обучения были разработаны для выполнения следующих задач: диагностики новообразований, идентификации их подтипов, классификации, стадирования и прогнозирования динамики заболевания [4, 5]. Глубокое обучение представляет собой подраздел машинного обучения, в котором алгоритмы разрабатываются для автоматического определения закономерностей в данных путем его обучения на нескольких примерах [6].
Количество публикаций, отражающих тестирования алгоритмов ИИ в области диагностики злокачественных новообразований, непрерывно растет. Среди них немало исследований, посвященных уропатологии, в частности раку предстательной железы и мочевого пузыря [7, 8, 9]. Встречаются также публикации о применении ИИ в диагностике меланом, а также метастатического поражения лимфатических узлов при раке молочной железы [10, 11, 12].
Цель исследования: провести обзор современной литературы и оценку перспектив использования ИИ в рутинной патолого-анатомической практике при диагностике опухолей органов ЖКТ.
Материалы и методы исследования
Поиск литературы проводился в электронных онлайн-базах данных PubMed, eLIBRARY.RU и CyberLeninka за период с 2011 по 2024 гг. с использованием ключевых слов: digital pathology, artificial intelligence, deep learning, esophageal cancer, stomach cancer, small intestine cancer, colon cancer, WSI, histopathological images. Проанализировано 49 источников литературы, из которых подробно изучены 26. Также в обзоре проанализирован 1 материал конференции. Основную часть составляют публикации зарубежных авторов с преобладанием статей о применении ИИ в диагностике рака желудка и толстой кишки ввиду их большей распространенности. Среди отечественной литературы были отобраны 4 статьи – обзора литературы. Основные публикации были концептуально распределены на две тематические категории: диагностика опухолей ЖКТ и предсказание молекулярно-генетического профиля опухолей ЖКТ.
Искусственный интеллект в патолого-анатомической диагностике злокачественных новообразований ЖКТ
Аденокарцинома пищевода составляет около двух третей случаев рака пищевода в странах с высоким доходом, причем основными факторами риска являются избыточная масса тела, гастроэзофагеальная рефлюксная болезнь и пищевод Барретта [1].
В исследовании N. Tomita и соавторы разработали алгоритм глубокой нейронной сети (НС), где обучаемый без предварительной ручной аннотации (разметки) областей интереса, для классификации гистологических изображений с целью выявления пищевода Барретта и аденокарциномы. Обучающий датасет, представляющий собой обработанную и структурированную информацию в табличном виде, включал 379 гистологических изображений: 195 нормальной слизистой, 80 – пищевода Барретта без дисплазии, 46 – с дисплазией и 58 – аденокарциномы. Проверку работоспособности модели осуществляли на тестовой выборке из 123 изображений. Результаты показали, что архитектура глубокого машинного обучения обнаруживает пищевод Барретта и аденокарциному, достигнув средней точности 83% при классификации тестовых изображений. Однако исследование имело ограничения: все эксперименты проводились на образцах из одного медицинского центра, соответственно препараты изготовлены и отсканированы на одном оборудовании; также объем данных был небольшим относительно средней выборки для глубокого обучения [13].
В исследовании O. Iizuka и соавторов ИИ обучен для классификации эпителиальных опухолей желудка и толстой кишки с использованием 4128 гистопрепаратов желудка и 4036 гистопрепаратов толстой кишки, полученных из больницы Хиросимского университета (Хиросима, Япония) и больницы Харадой (Фукуока, Япония), которые вручную были размечены и аннотированы врачами-патологоанатомами, с выделением областей, соответствующих аденокарциноме, аденоме и нормальной ткани. Далее была обучена сверточная нейронная сеть (CNN) на основе архитектуры inception-v3, c последующим добавлением алгоритмов рекуррентных нейронных сетей (RNN). Набор данных желудка состоял только из биопсийных изображений, тогда как набор данных толстой кишки включал как биопсии, так и хирургические образцы. Модель для толстой кишки показала лучшие результаты (AUC=0,982) по сравнению с моделью для желудка (AUC=0,924), что исследователи связывают с наличием операционного материала толстой кишки в обучающем датасете. Результаты исследования продемонстрировали значительный потенциал для внедрения в гистопатологическую диагностику [14].
Y. Li совместно с коллегами разработали новую архитектуру на основе сверточных нейронных сетей (CNN) c добавлением Multi-scale module (MSM), названную GastricNet, для автоматической диагностики рака желудка. Обучающий датасет включал в себя 560 гистопрепаратов с карциномой желудка и 140 – с нормальной слизистой желудка; тестовая выборка включала 140 гистопрепаратов (112 – с карциномой и 28 – с нормальной слизистой желудка). Точность классификации данной системы достигла 100% на гистологических срезах желудка, что превысило результаты других существующих моделей, таких как DenseNet и ResNet [15].
H. Sharma и коллеги в своем исследовании отметили, что архитектура разработанного ИИ на основе сверточных нейронных сетей (CNN) демонстрирует высокую эффективность в анализе патологических изображений, достигая точности 69,9% при классификации рака желудка и 81,4% при выявлении некроза опухоли [16].
Одной из рутинных задач патолого-анатомической службы в диагностике рака является не только обнаружение злокачественной опухоли, но и определение степени ее злокачественности. В случае рака толстой кишки эта классификация основывается на морфологических характеристиках и степени развития железистых структур. Однако из-за субъективности оценки могут возникать расхождения во мнениях между различными патологоанатомами.
В исследовании, проведенном R. Awan и соавторами, была применена пиксельная глубокая НС для сегментации желез, обученная на оцифрованных изображениях тканей, окрашенных гематоксилин-эозином[C1]. Данные для исследования были собраны из University Hospitals Coventry and Warwickshire (UHCW) NHS Trust в Ковентри (Великобритания). В работе использовались 38 оцифрованных слайдов тканей карцином толстой кишки, из которых было извлечено несколько неперекрывающихся изображений размером 4548×7548 пикселей при увеличении микроскопа «20×». Эти изображения были помечены экспертом-патологоанатомом как нормальная ткань, опухоль низкой или высокой степени злокачественности. В итоге было получено 139 изображений, включая 71 нормальное, 33 изображения рака низкой степени злокачественности и 35 изображений рака высокой степени злокачественности. Для сегментации желез использовалась архитектура сверточной НС, основанная на модифицированной версии «UNET», предложенной И.О.Роннебергером и соавторами. В исследовании проводилась двухклассовая классификация изображений на нормальную и опухолевую ткань, а также трехклассовая классификация на нормальную ткань, низкодифференцированный и высокодифференцированный рак. Задача обнаружения границ желез была решена с помощью глубокой сверточной НС, специально разработанной для сегментации железистых структур. Была достигнута точность 97% для двухклассовой классификации и 91% – для трехклассовой [17].
Своевременное обнаружение и тщательное исследование полипов толстой кишки способствуют выявлению рака толстой кишки на ранних стадиях, что приводит к улучшению результатов лечения.
B. Korbar, A.M. Olofson, A.P. Miraflor и соавторы разработали метод автоматизированного анализа изображений, который позволяет классифицировать различные типы колоректальных полипов на полноразмерных слайдах, что может оказать помощь патологоанатомам в их характеристике и диагностике. В исследовании было использовано 2074 слайда, включая нормальную ткань (237 слайдов), виллезные и тубуло-виллезные аденомы (202), тубулярные аденомы (360), традиционные зубчатые полипы (258), сидячие зубчатые полипы (258) и гиперпластические полипы (405). Для идентификации колоректальных полипов и их типов на изображениях всего слайда применялась модель глубокого обучения, при этом изображения разбивались на более мелкие перекрывающиеся участки. Модель вывода, основанная на архитектуре «ResNet», оценивалась для классификации колоректальных полипов на 239 независимых изображениях, окрашенных гематоксилин-эозином. Результаты исследования продемонстрировали высокую производительность по различным классам, с общей точностью 93% [18].
S. Soldatov, D. Pashkov, S. Guda и соавторы в своем исследовании применили методы глубокого обучения для диагностики шести типов поражений слизистой оболочки толстой кишки с использованием сверточных НС. В результате был разработан алгоритм автоматической сегментации изображений биопсий толстой кишки. Данное исследование продемонстрировало сложность дифференциальной диагностики между структурами трубчатой аденомы, ворсинчатой аденомы и высокодифференцированной аденокарциномы. Развитие высокодифференцированной аденокарциномы часто возникает на фоне тубулярной и ворсинчатой аденом. В процессе маркировки этих структур, окрашенных гематоксилин-эозином, патологи сталкиваются с переходными зонами, что приводит к их классификации как неопределенных. В отличие от этого, другие структуры не вызывают разночтений среди специалистов [19].
Искусственный интеллект в прогнозировании молекулярно-генетического профиля новообразований желудочно-кишечного тракта
Определение молекулярного профиля опухолей имеет ключевое значение для выбора стратегии лечения пациента и оценки его прогноза. Согласно данным исследовательской сети «The Cancer Genome Atlas» (TCGA), рак желудка делится на четыре молекулярных подтипа: опухоли, ассоциированные с вирусом Эпштейна–Барр (ВЭБ), опухоли с микросателлитной нестабильностью (MSI), геномно стабильные опухоли и хромосомно нестабильные опухоли [20]. Эта классификация рака желудка важна для выбора таргетной терапии для пациентов. Микропрепараты пациентов с ВЭБ-ассоциированным раком желудка, окрашенные гематоксилин-эозином, демонстрируют такие морфологические признаки, как низкая степень дифференцировки опухоли и выраженная лимфоцитарная инфильтрация. Пациенты с такими характеристиками направляются на тестирование на наличие ВЭБ.
X. Zheng, R. Wang, X. Zhang и соавторы провели исследование, в котором была представлена новая модель глубокого обучения, названная «EBVNet», для прогнозирования статуса ВЭБ у пациентов с раком желудка, используя гистологические слайды, окрашенные гематоксилин-эозином. В рамках исследования применялись три различных набора данных. В качестве внутреннего набора использовались 203 образца от пациентов с ВЭБ-позитивным раком желудка и 803 образца от 582 пациентов с ВЭБ-негативным статусом. Для валидации модели были использованы два независимых внешних набора данных: «MultiCenter-STAD» – внешний набор данных из нескольких медицинских центров и «TCGA-STAD» – внешний набор данных из The Cancer Genome Atlas. Прогнозирование статуса ВЭБ осуществлялось на основе автоматически выделенных областей опухоли, определенных с помощью разработанного детектора опухолей, обученного на внутреннем наборе данных. Этот детектор продемонстрировал чувствительность 0,964 и AUROC 0,862 на наборе «MultiCenter-STAD», а также чувствительность 0,945 и AUROC 0,848 на «TCGA-STAD». Результаты прогноза для «MultiCenter-STAD» показали значительную корреляцию с медуллярной гистологией, муцинозной и папиллярной дифференцировкой, наличием перстневидных клеток, низкой дифференцировкой, вакуольным ядром и отчетливо видимым ядрышком. В наборе данных «MultiCenter-STAD» модель «EBVNet» достигла AUROC 0,941, чувствительности 96,9% и специфичности 75,9%. Диагностическая эффективность «EBVNet» превысила результаты сертифицированных патологов [21]. Как уже было упомянуто выше, определение MSI при некоторых видах опухолей ЖКТ играет ключевую роль в выборе тактики лечения, поскольку позволяет идентифицировать пациентов с различными ответами на терапию и прогнозами.
R. Yamashita, J. Long, T. Longacre и соавторы разработали модель глубокого обучения под названием «MSINet», используя 100 слайдов, окрашенных гематоксилин-эозином, из которых 50 демонстрировали микросателлитную стабильность (MSS), а 50 – нестабильность (MSI). Слайды были получены от случайно выбранных пациентов из группы 343 человек, перенесших первичную резекцию толстой кишки в Медицинском центре Стэнфордского университета. Внутреннюю проверку модели проводили на контрольном наборе из 15 случаев (7 с MSS и 8 с MSI), в то время как внешняя проверка осуществлялась на 484 слайдах (402 случая с MSS и 77 с MSI). Эффективность модели оценивалась по таким параметрам, как чувствительность, специфичность и площадь под кривой рабочей характеристики приемника (AUROC). Модель «MSINet» продемонстрировала AUROC 0,931 на внутреннем контрольном наборе данных и 0,779 – на внешнем наборе. На внешнем наборе данных модель достигла чувствительности 76,0% и специфичности 66,6%. Данная модель глубокого обучения превзошла результаты опытных врачей-патологоанатомов в области ЖКТ в предсказании MSI на образцах, окрашенных гематоксилин-эозином [22].
K. Ding, M. Zhou, H. Wang и соавторы предложили метод, основанный на графовых НС, который акцентирует внимание на пространственном расположении опухолевых плиток для всесторонней оценки прогнозирования межуровневых молекулярных профилей, включая генетические мутации, изменения числа копий и функциональные выражения белков на основе изображений целых слайдов. Графовые НС представляют собой тип нейронных сетей, специально разработанных для обработки данных, представленных в виде графов. Графы состоят из узлов (вершин) и ребер (связей между узлами), что позволяет моделировать сложные взаимосвязи и структуры, встречающиеся в различных областях, таких как социальные сети, биология, транспортные системы и многие другие. Модель была разработана с использованием 459 изображений слайдов опухолей толстой кишки из базы данных «TCGA-COAD» и прошла внешнюю валидацию на 165 изображениях слайдов опухолей прямой кишки из «TCGA-READ» и 161 изображении слайдов опухолей толстой кишки из «CPTAC-COAD» (Clinical Proteome Tumor Analysis Consortium). Результаты исследования показали, что пространственно связанные графовые модели способны эффективно прогнозировать молекулярные профили при раке толстой кишки [23].
Одним из ключевых прогностических факторов при диагностике рака толстой кишки является его микроокружение, формируемое взаимодействием между опухолевыми клетками и различными типами окружающих клеток. Недавние исследования продемонстрировали, что опухоль способна перепрограммировать свое микроокружение таким образом, что оно способствует как развитию первичных опухолей, так и их метастазированию, становясь важным регулятором онкогенеза [24].
В работе Y. Jiao, J. Li, C. Qian и соавтора было проведено исследование, в котором с помощью сверточной НС анализировались изображения целых слайдов аденокарциномы толстой кишки с автоматизированным анализом микросреды опухоли на основе сегментации всего предметного стекла. Метод был протестирован на образцах аденокарциномы толстой кишки из проекта «The Cancer Genome Atlas». Результаты показали, что высокий уровень некроза и наличие лимфоцитов коррелируют с неблагоприятным прогнозом, что подтверждает сложную роль микроокружения опухоли в аденокарциноме толстой кишки. Данный метод может быть применен для стратификации риска и подбора таргетной терапии для пациентов с раком толстой кишки, а также адаптирован для использования при злокачественных новообразованиях других локализаций [25].
Согласно проведенному анализу данных, на сегодняшний день использование искусственного интеллекта демонстрирует различные возможности в диагностике новообразований ЖКТ. Это позволяет не только выявлять наличие опухоли, но и оценивать факторы с прогностическим значением. Кроме того, ряд исследований продемонстрировал потенциал искусственного интеллекта в прогнозировании молекулярного профиля опухолей.
Интеграция подобного инструмента в рутинную прижизненную патолого-анатомическую практику в качестве второго мнения и контроля качества могла бы значительно помочь в снижении количества диагностических ошибок, а также затрачиваемого на диагностику времени [26, 27]. В то же время пока еще очень мало проектов используются в практической врачебной деятельности, что обусловлено этическими сложностями и недостаточно проработанной правовой базой.
Заключение
В статье представлены и проанализированы исследования, касающиеся патолого-анатомической диагностики опухолей ЖКТ с использованием искусственного интеллекта. Хотя предложенные алгоритмы машинного обучения еще не достигли совершенства, они уже демонстрируют обнадеживающие результаты. Дальнейшая разработка и усовершенствование этих алгоритмов, а также их интеграция в процессы вычислительной патологии могут значительно облегчить растущую нагрузку на патологоанатомов.