Собрать пазл без половины деталей

Новости науки

Российские ученые — в топ-10 международного соревнования по восстановлению томографических сканов сердца

Искусственный интеллект приходит на помощь в решении одной из важных задач медицинской диагностики. Используя генеративные алгоритмы, подобные тем, что применяются для улучшения качества старых фотографий, специалисты учатся “достраивать” недостающие фрагменты на медицинских снимках, превращая неполные или нечеткие данные в информативные изображения. Особенностью этой задачи в медицинском компьютерном зрении является острая нехватка общедоступных наборов сырых данных k-пространства — это исходные данные, которые томограф собирает перед построением финального изображения.

Для поиска эффективных решений этой проблемы был организован международный конкурс по восстановлению томографических сканов сердца CMRxRecon, проведенный совместно с 27-й Международной конференцией по медицинской визуализации MICCAI. Участникам был предоставлен обширный датасет k-пространства, включающий сырые данные картирования и подробные аннотации анатомических структур сердца. В соревновании приняло участие около 600 команд со всего мира.

Единственной командой из России, сумевшей пробиться в топ-10 призовых мест, стала сборная лаборатории «Сильный ИИ в медицине» Института AIRI и Сколтеха. Представленное ими решение продемонстрировало высокую стабильность в различных номинациях: в отличие от узкоспециализированных подходов конкурентов, команда заняла шестое-седьмое места сразу во всех восьми категориях оценки. Важно отметить, что, хотя само соревнование прошло в 2023 году, детали решения и достигнутые результаты были опубликованы в ведущем журнале по медицинской визуализации только весной 2025 года из-за длительного процесса рецензирования.

О том, зачем ученые участвуют в подобных соревнованиях и каковы перспективы применения искусственного интеллекта для кардиологического скрининга, рассказывает Дмитрий Дылов, Ph.D., руководитель лаборатории «Сильный ИИ в медицине» Института AIRI и руководитель лаборатории вычислительных методов формирования изображений Центра ИИ Сколтеха.

— Зачем вообще улучшать МРТ? Кажется, что современная медицина вполне успешно освоила магнитно-резонансную томографию?

— Начнем с того, как проходит исследование в МРТ-аппарате. Пациент располагается на кушетке и перемещается внутрь сканера. Далее начинается процесс сбора частот Фурье — это источник тех самых громких звуков, которые мы слышим во время процедуры. Аппарат последовательно собирает данные на одной частоте, затем перенастраивается для сбора на другой, и так далее. Этот процесс может занимать от 20–40 минут до целого часа, требуя от пациента оставаться совершенно неподвижным для получения четкого изображения.

Это довольно длительная процедура, а количество пациентов, нуждающихся в ней, постоянно растет. В поисках способов ускорить процесс возник вопрос: а что, если сканировать не каждую доступную частоту? Получится ли при этом изображение хорошего качества? Этот вопрос положил начало целому направлению исследований, использующему методы Компрессионного или разряженного семплирования (Compressed Sensing/Sampling). В рамках этих подходов ученые разрабатывают методики получения и восстановления сигналов, опираясь на знания об их предыдущих значениях. То есть часть частот при сканировании пропускается, а возникшие “пробелы” заполняются с помощью математических алгоритмов. Подобным алгоритмам уже около 50 лет, но сейчас к задаче вернулись вновь, в первую очередь из-за необходимости ускорить МРТ и, конечно, благодаря появлению современных методов ИИ.

— Как работали эти методы до появления ИИ и что изменилось с его приходом?

— Изначально подход был довольно простым: брались два известных крайних значения, а значение в промежуточной точке, например, в середине интервала, определялось путем линейной интерполяции, по сути, как среднее арифметическое этих двух значений. Это очень упрощенный подход, который, конечно, не учитывал возможную нелинейность данных.

С появлением глубокого обучения и генеративного искусственного интеллекта появилась возможность гораздо точнее предсказывать, какая информация должна находиться в этих пропусках, и “дорисовывать” итоговые изображения, учитывая эти предсказания. Но речь идет не только об анатомических деталях, но и о фундаментальных физических ограничениях. Например, если попытаться ускорить сканирование в частотном представлении сигнала, просто пропуская каждую вторую частоту, после обратного преобразования Фурье вылезут явные артефакты. Представьте: вместо одного сердца на снимке появится “эхо” — контуры начнут дублироваться, и будет казаться, что на изображении три сердца. Если не учитывать такие моменты, восстановленная картинка получится “грязной”, с шумами, размытием и фантомными структурами.

— Получается, при ускорении появление артефактов неизбежно?

— Не совсем. Если правильно обучить модель, то “заполнение” недостающих частот будет происходить с учетом как физики процесса сканирования, так и априорных знаний об анатомии. Именно здесь в игру вступает генеративный искусственный интеллект, который можно научить эффективно избавляться от артефактов. И это касается не только МРТ. С применением ИИ-алгоритмов мы не просто интерполируем пробелы, а стараемся учитывать физические принципы процесса. В МРТ это магнитные поля, релаксация намагниченности тканей, а в КТ — поглощение рентгена. В низкодозной компьютерной томографии (LDCT) врачи сознательно снижают дозу излучения, что приводит к большей зашумленности изображений. Умные алгоритмы “достраивают” недостающее, опираясь на паттерны из тренировочных данных. Это как собрать пазл, потеряв половину деталей, но точно зная, как должна выглядеть итоговая картинка. При этом методика обучения сама следит за тем, чтобы ИИ не генерировал бессмысленные или нереалистичные структуры, и восстанавливаемые анатомические детали имели смысл.

— Расскажите подробнее о конкурсе CMRxRecon и решении вашей команды. Почему это соревнование так важно для сообщества исследователей ИИ в медицине?

— Обычно из МРТ-аппарата можно получить DICOM-файлы — уже готовые изображения, которыми пользуются врачи, например, снимки сердца. Но “под капотом” лежат сырые данные частотного пространства, из которых потом формируется изображение. Именно эти сырые данные предоставили организаторы конкурса для обучения ИИ-алгоритмов. Во-первых, такие данные очень объемные, а во-вторых, найти их в открытых источниках практически невозможно. Кроме того, сердца отличаются не только морфологией — формой и размером, но и динамикой, например, особенностями биения и реакции на нагрузку. Чтобы алгоритм не “заучивал” специфику узкой выборки, набор данных должен включать огромное количество примеров, учитывающих различную геометрию, возможные патологии, охватывать разные возрастные группы. Разнообразие обучающей выборки позволяет “усреднить” индивидуальные отклонения и выявить общие закономерности. Организаторы конкурса предоставили доступ как к сырым данным, так и к финальным изображениям обширного и репрезентативного набора реальных данных, и мы можем использовать этот ценный опыт в дальнейших исследованиях.

— Ваша команда вошла в топ-10 во всех номинациях. Как вы этого добились?

— Основная задача соревнования заключалась в поиске оптимальной последовательности сбора частот для максимально возможного улучшения качества финального изображения. Мы намеренно избегали исключительно “хайповых” решений, полностью основанных на новейших ИИ-технологиях, и применили гибридный подход. Мы использовали нейронные сети для аппроксимации и улучшения результатов классических методов, о которых я говорил в самом начале нашей беседы. В итоге получилось универсальное и очень надежное решение.

— Почему публикация результатов заняла два года?

— Когда речь идет о медицинских данных, процесс рецензирования всегда очень длительный. Препринты на том же arxiv могут ожидать публикации до пяти лет. Это связано прежде всего с тем, что журналу необходимо найти рецензентов, которые глубоко разбираются как в медицинской, так и в технической части работы. Также требуется заключение врачей-специалистов, которые подтвердят, что с точки зрения медицинской статистики все сделано корректно. Авторам, в свою очередь, необходимо дать исчерпывающие ответы на все вопросы рецензентов, что зачастую требует не просто письменных пояснений, но и поиска дополнительных данных, иллюстрации своих утверждений. Результаты нашего соревнования были представлены в ведущем журнале Medical Image Analysis. Его репутация в научном сообществе настолько высока, что если у хотя бы одного из рецензентов возникают сомнения, приглашаются дополнительные эксперты, и работа отправляется на новый виток проверок.

— Зачем вообще нужны научные соревнования?

— Всегда есть некая конкретная и актуальная задача. Полная проверка жизнеспособности амбициозной гипотезы от начала и до конца зачастую невозможна в рамках одной компании, даже очень крупной. Это требует огромного количества сотрудников и значительных финансовых вложений. Однако компания может инвестировать в подготовку основы для проверки гипотезы — собрать уникальный датасет или определить метрики оценки — и организовать конкурс, чтобы привлечь к проблеме множество внешних специалистов. В хороших, авторитетных соревнованиях получается выигрыш для всех сторон: организаторы получают своего рода краудсорсинг идей и первичное представление о том, в каком направлении лучше развивать свой проект и куда инвестировать; участники получают возможность сравнить свои наработки с другими командами, получить доступ к уникальным данным, ну и, конечно, лучшие результаты затем публикуются в открытом доступе, становясь основой для дальнейших исследований всего научного сообщества. Организовать соревнование может не только “клинический партнер”. Иногда это отдельный научный коллектив, техническая команда или даже крупная клиника. Для студента, кстати, призовое место в одном из таких конкурсов — это очень мощный старт для карьеры.

Лично я очень люблю использовать соревнования как мотивационный фактор для молодых ученых в своей лаборатории. Помимо практической ценности, это дополнительная строка в их резюме, возможность пообщаться с другими экспертами, с такими же аспирантами, как они сами. Иногда есть и призы, в том числе весьма ощутимые денежные суммы, что для студента всегда приятный бонус. Себя я мотивирую успехами моих подопечных. Да и, честно говоря, когда твоя модель обходит сотни других, понимаешь, что бессонные ночи, потраченные на анализ и отладку (поиск и устранение ошибок в программе), были не зря.

— Организаторы проверяют гипотезы. А какую практическую пользу, помимо признания, получают участники конкурсов?

— Как минимум, доступ к уникальным данным. Я напомню, что самостоятельно собрать такой объем данных очень сложно, долго и дорого. В остальном польза та же самая, что и для организаторов. Перспектива становится ясна на примере кардиологического скрининга: ускорение МРТ-процедуры позволит чаще обследовать сердце, в том числе и у здоровых людей. Мы, приняв участие в соревновании, уже получили набор работающих (и нерабочих) подходов от топ-10 команд. Представим, что перед нами встанет государственная задача включения МРТ-исследования в рутинный кардиоскрининг населения. Так же, как сейчас делается флюорография грудной клетки раз в год, но только для сердца. Что нужно сделать на первом этапе, чтобы процедура стала быстрой и доступной для всех? Проанализировав решения участников соревнования, можно сразу отбросить бесперспективные пути и исключить этот начальный этап научного поиска в своей стране. Это очень сильно экономит время.

Еще один важный плюс — это бенчмарк, то есть точка отсчета. Соревнования помогают создать унифицированное, стандартизированное пространство для количественной оценки различных моделей и понимания пределов применимости нейронных сетей и других алгоритмов в решении медицинских задач. Наша лаборатория, например, задалась вопросом: до каких пределов вообще можно ускорять МРТ? В этом конкурсе участники смогли достичь ускорения сканирования в восемь раз. Мы же в других исследованиях проработали и оценили альтернативные подходы и смогли добиться 16-кратного, а в определенных условиях и 32-кратного ускорения. Если такие результаты удастся реализовать на практике, рутинные проверки сердца с помощью МРТ для широких слоев населения станут реальностью.

— Звучит как та самая коллективная международная наука, которая…

— …жива.

— Вернемся к применению ИИ в анализе медицинских изображений. На каком этапе сейчас находится область исследований в сфере ускорения МРТ?

— Большая часть исследований пока находится довольно далеко от прямого внедрения в МРТ-аппараты, поскольку “внутрь” могут попасть только алгоритмы производителей самого оборудования. Однако уже около пяти лет назад американское Управление по санитарному надзору за качеством пищевых продуктов и медикаментов (FDA) начало одобрять первые модули с искусственным интеллектом для реконструкции изображений прямо “под капотом” в аппаратах известных брендов медицинских сканеров. Проводятся многочисленные калибровки, проверки, валидационные эксперименты. Крайне важно, чтобы то, что “дорисовывается” алгоритмами, имело смысл для врачей. Самый простой подход, который приходит в голову, — взять любую сверточную сеть, набор данных, где измерены все частоты, и данные, где часть частот отсутствует, а затем натренировать нейронную сеть так, чтобы она из неполных данных делала полные. В результате получатся красивые, хорошо выглядящие картинки, но у них с высокой вероятностью появятся анатомические структуры, которых нет в реальности. Опытный глаз специалиста по лучевой диагностике тут же это заметит. Для контроля генерации используются специальные техники, называемые регуляризациями. И даже после их применения восстановленные наборы данных обязательно должны пройти валидацию у врачей.

Поскольку мы не производим собственные МРТ-аппараты, полученные в ходе исследований по ускорению МРТ результаты можно синтетически сопоставлять с базами данных кардиологических центров. Сейчас мы активно изучаем перспективы внедрения различных ИИ-алгоритмов в рутинный кардиоскрининг. Например, у нашей лаборатории есть отдельные проекты с НМИЦ им. В. А. Алмазова и НМИЦ кардиологии имени академика Е. И. Чазова по поиску ранних признаков сердечно-сосудистых заболеваний у российской популяции.

— И как, на ваш взгляд, можно улучшить текущий скрининг, чтобы выявлять риски на ранних стадиях?

— Классический скрининг здоровых людей обычно включает анализ крови, иногда ЭКГ, и реже УЗИ сердца или сосудов. Но есть важный нюанс: у здоровых пациентов стандартные биомаркеры могут быть в норме в день анализа, а ухудшение обнаруживается только при повторном визите, когда патология уже очевидна. Чтобы находить ранние признаки, в идеальном мире нужен стандартизированный мультимодальный подход: человек сдал кровь, сделал ЭКГ и прошел быстрый МРТ-скан — и все это за один визит, не перемещаясь по разным кабинетам. Если собрать такой массив данных для нескольких десятков тысяч пациентов, ИИ сможет научиться выявлять скрытые закономерности и ранние признаки заболеваний. Доступность и высокая скорость сканирования здесь будут играть ключевую роль.

Очень хочется, чтобы люди стали больше внимания уделять такой рутинной проверке своей сердечно-сосудистой системы и чтобы скрининг анатомических структур сердца с помощью МРТ вошел в общую практику.

— Представим, что в ближайшем будущем искусственный интеллект и алгоритмы научатся идеально восстанавливать изображения в ходе кардиоскрининга. Что дальше?

— Если помечтать, то, мне кажется, мы окажемся на пороге открытия технологии, которая позволит мониторить функциональные, биохимические и анатомические характеристики нашей сердечно-сосудистой системы практически в реальном времени. Примерно так же, как мы сейчас носим умные часы на руке и измеряем пульс, ищем аритмию. Появятся очень интересные долгосрочные (продольные) исследования с использованием таких устройств, когда одни и те же пациенты будут наблюдаться в течение длительного времени. Сегодня нам несложно взять и сохранить фотографию на телефоне. А что, если так же легко можно будет сделать и сохранить мгновенный МРТ-скан сердца? В результате будет накоплен значимый датасет, и мы сможем начать отвечать на вопросы, которые пока даже никто не решается задавать — например, о процессах формирования, старения и контроля износа тканей сердца на уровне каждого конкретного человека.

Виктор Лебедев
Виктор Лебедев

Виктор Лебедев - политический обозреватель из Ярославля с 8-летним стажем. Специализируется на анализе международных отношений и региональной политики центрального федерального округа.

Обзор последних событий в мире шоу-бизнеса