Новая генеративная модель ИИ может реконструировать высококачественное 3D-изображение КТ с разреженным изображением и гораздо меньшей дозой рентгеновского облучения
Результаты реконструкции 3D-КТ в восьми проекциях из общедоступного набора данных. Слева направо: фильтрованная обратная проекция (FBP), разложенный диффузионный сэмплер (DDS), DiffusionPatch, DiffusionBlend+ (это исследование), DiffusionBlend++ (это исследование), Ground Truth. 

Хотя 3D КТ-сканирование обеспечивает детальные изображения внутренних структур, 1000–2000 рентгеновских лучей, полученных под разными углами во время сканирования, могут увеличить риск рака у уязвимых пациентов. КТ-сканирование с разреженным обзором, которое захватывает всего 100 или даже меньше рентгеновских проекций, радикально снижает воздействие радиации, но создает проблемы для реконструкции изображения.

Недавно контролируемые методы обучения — тип машинного обучения, который обучает алгоритмы с помощью маркированных данных — улучшили скорость и разрешение реконструкций изображений МРТ с недостаточной выборкой и КТ с разреженным обзором. Однако маркировка этих больших наборов данных для обучения требует много времени и средств.

Инженерные исследователи Мичиганского университета возглавили разработку новой структуры под названием DiffusionBlend, которая может эффективно работать с 3D-изображениями, что делает метод значительно более применимым к КТ и МРТ. Результаты опубликованы на сервере препринтов arXiv .

DiffusionBlend использует  — самоконтролируемую технику обучения, которая изучает распределение данных заранее — для выполнения реконструкции 3D КТ с разреженным видом посредством апостериорной выборки. Исследование было представлено сегодня на конференции по системам обработки нейронной информации ( NeurIPS ) в Ванкувере, Британская Колумбия.

«Наш новый метод повышает скорость и эффективность, а также качество реконструкции, что имеет решающее значение для  », — сказал Боуэн Сонг, докторант кафедры электротехники и вычислительной техники Мичиганского университета и один из первых авторов исследования.

DiffusionBlend изучает пространственные корреляции между группой соседних срезов 2D-изображения, называемых априорной диффузией 3D-патча, а затем объединяет оценки многосрезовых патчей для моделирования всего объема 3D-изображения КТ.

При тестировании на общедоступном наборе данных 3D-КТ-сканов с разреженной проекцией метод DiffusionBlend превзошел различные базовые методы, включая четыре диффузионных подхода в восьми, шести и четырех проекциях, обеспечив сопоставимое или лучшее качество вычислительного изображения.

«До сих пор требования к памяти и низкая вычислительная эффективность диффузионных моделей ограничивали их практическое применение. Наш подход преодолевает эти препятствия, делая шаг в правильном направлении», — сказал Лиюэ Шэнь, доцент кафедры электротехники и вычислительной техники UM и старший автор исследования.

Дальнейшее повышение практичности и ускорение методов позволило сократить время реконструкции КТ с помощью DiffusionBlend до одного часа, тогда как предыдущие методы требовали до 24 часов.

«Было удивительно, насколько можно ускорить процесс, не жертвуя качеством реконструкции. Мы сочли это очень полезным», — сказал Джейсон Ху, докторант кафедры электротехники и вычислительной техники UM и один из первых авторов исследования.

Методы глубокого обучения могут вносить ошибки, которые вызывают визуальные артефакты — тип галлюцинации ИИ, который создает изображение чего-то, чего на самом деле нет. Когда дело доходит до диагностики пациентов, визуальные артефакты быстро становятся большой проблемой.

Исследователи подавили визуальные артефакты посредством оптимизации согласованности данных, в частности, с помощью метода сопряженных градиентов, и измерили, насколько хорошо сгенерированные изображения соответствуют измерениям с помощью таких показателей, как отношение сигнал/шум.

«Мы все еще находимся на ранней стадии развития этого метода, но здесь есть большой потенциал. Я думаю, что принципы этого метода могут быть распространены на четыре измерения, три пространственных измерения плюс время, для таких приложений, как визуализация  или сокращений желудка», — сказал Джефф Фесслер, заслуженный профессор электротехники и компьютерных наук имени Уильяма Л. Рута в UM и соавтор исследования.

Внимание, автоперевод! За ошибки перевода ответственности не несём. Первоисточник по ссылке.