CXR является одним из наиболее распространенных визуализирующих исследований, ежегодно во всем мире проводится более 830 миллионов исследований. Значительные усилия были вложены в разработку моделей глубокого обучения (DL) на основе ИИ для обнаружения аномалий CXR. Однако разработка ИИ для CXR является сложной задачей, поскольку требует чрезвычайно больших наборов обучающих данных с ручной маркировкой и способности обобщать данные для различных групп населения и учреждений.

«Создание этих больших баз данных занимает много времени», — сказал соавтор исследования Моззияр Этемади, доктор медицинских наук, доцент кафедры анестезиологии и биомедицинской инженерии в Северо-Западной медицине в Чикаго. «Вы должны извлечь данные из клинической системы, которые могут включать сотни тысяч записей о пациентах, и вы должны тщательно удалить все идентификаторы пациентов по соображениям конфиденциальности. Это все еще до того, как вы начнете думать о маркировке данных вручную».

Доктор Этемади сотрудничал с исследователями из Google, чтобы разработать гораздо более быстрый процесс разработки модели классификации CXR, требующий значительно меньше данных и меток.

Новый метод работает путем преобразования изображений CXR в богатые информацией числовые векторы, которые можно использовать для более простого обучения моделей для конкретных задач медицинского прогнозирования, таких как клиническое состояние или исход пациента.

«Компьютер воспринимает CXR как серию чисел», — сказал Эндрю Селлергрен, инженер-программист Google Health, который работает в команде, занимающейся использованием машинного обучения для решения проблем здравоохранения. «Наша модель берет эти миллионы чисел и сжимает их в гораздо меньший массив чисел порядка нескольких тысяч, что значительно упрощает разработку модели. Да, при использовании этого метода происходит некоторая потеря информации, но надежда состоит в том, чтобы сохранить и даже расширить информацию, наиболее важную для классификации и диагностики, подобно тому, как рентгенологический отчет стремится резюмировать изображение».

Стохастический сосед с t-распределением, встраивающий визуализации вложений на каждом этапе нашей трехэтапной обучающей установки. Контрастные встраивания с учителем (SupCon) дали лучшее визуальное разделение классов (в центре), чем обычная предварительно обученная сеть (слева), и такое же хорошее разделение, как полностью настроенная сеть (справа). Обратите внимание, что этот метод визуализации использует сильно нелинейные оси, поэтому ни одной из осей нельзя присвоить легко интерпретируемые единицы измерения. CXR = рентгенография грудной клетки, ImageNet = набор данных, содержащий естественные изображения, JFT-300M = больший набор данных, содержащий естественные изображения.

ИИ помог сократить количество необходимых изображений набора данных

Чтобы облегчить разработку модели, исследователи использовали контролируемое контрастивное обучение (SupCon) — методологию обучения, основанную на методах обучения с самоконтролем.

«С помощью SupCon мы объединяем изображения, похожие друг на друга, и раздвигаем изображения, отличающиеся друг от друга», — сказал Селлергрен. «В этом контексте вы можете глубоко погрузиться в обычные изображения, сгруппированные вместе; внутри аномального пространства вы можете погрузиться еще глубже в это сжатое пространство».

Селлергрен, доктор Этемади и их коллеги изучили подход к 10 задачам прогнозирования CXR, включая переломы, туберкулез и исходы COVID-19. По сравнению с переносом обучения из немедицинского набора данных, SupCon сократила требования к маркировке для большинства задач до 688 раз и увеличила площадь под кривой рабочей характеристики приемника (AUC) при соответствующих размерах набора данных. На крайне низком конце спектра обучающие модели, использующие только 45 CXR, дали AUC 0,95 при классификации туберкулеза, что аналогично показателям рентгенологов.

«Обычно для моделей требуются сотни тысяч или даже миллионы рентгеновских снимков грудной клетки с ручной маркировкой», — сказал доктор Этемади. «У нас есть модель, которая очень хорошо работала всего с 45 рентгеновскими снимками, а это означает, что с помощью этого нового подхода вы можете снизить потребность в CXR на много порядков».

Доктор Этемади подчеркнул, что результаты не имеют прямого клинического применения. Вместо этого они представляют собой веху на пути к эффективному проектированию, открывая возможность быстрого обучения моделей рентгенографии грудной клетки на небольших наборах данных или при недостатке данных.

«Все дело в том, чтобы попытаться ускорить процесс создания алгоритмов ИИ, чтобы мы могли делать это чаще и могли более оперативно и эффективно внедрять технологию в клиническую помощь в режиме реального времени», — сказал д-р Этемади.

Преимущества сотрудничества между медициной и инженерией

Исследователи хотят расширить свои исследования за пределы CXR на другие методы визуализации. Они также планируют повысить осведомленность о важности образования в области технологии, поскольку существуют разные стандарты передовой инженерной практики по сравнению с традиционной работой ИИ.

И доктор Этемади, и Селлергрен приписывают успех исследования сотрудничеству между инженерами, радиологами и другими врачами.

«Лучший путь вперед — это открыться для прослушивания с обеих сторон», — сказал Селлергрен. «У нас была возможность выложить кое-что и начать разговор, и, надеюсь, мы услышим об этом хорошие отзывы, а также о некоторых способах его улучшения».