Клиническое использование инструментов искусственного интеллекта на основе глубокого обучения для диагностики все еще находится в зачаточном состоянии.


Выстрел в голову доктора Луи Линда Плеснера

Плеснер

Согласно исследованию, опубликованному в журнале Radiology, при исследовании более 2000 рентгенограмм грудной клетки рентгенологи превзошли искусственный интеллект в точном определении наличия и отсутствия трех распространенных заболеваний легких .

«Рентгенография грудной клетки является распространенным диагностическим инструментом, но для правильной интерпретации результатов исследования требуется значительная подготовка и опыт», — сказал ведущий исследователь Луи Л. Плеснер, доктор медицинских наук, ординатор-рентгенолог и научный сотрудник отделения радиологии больницы Херлев и Гентофте в Копенгагене. Дания.

Хотя коммерчески доступные и одобренные FDA инструменты искусственного интеллекта доступны для помощи рентгенологам, доктор Плеснер сказал, что клиническое использование инструментов искусственного интеллекта на основе глубокого обучения для радиологической диагностики находится в зачаточном состоянии.

«Хотя инструменты искусственного интеллекта все чаще одобряются для использования в радиологических отделениях, существует неудовлетворенная потребность в дальнейшем тестировании их в реальных клинических сценариях», — сказал доктор Плеснер. «Инструменты искусственного интеллекта могут помочь рентгенологам в интерпретации рентгенограмм грудной клетки, но их реальная диагностическая точность остается неясной».

Радиология Плеснера Рис. 6. Рентгенография грудной клетки с искусственным интеллектом.

Репрезентативные рентгенограммы грудной клетки у шести пациентов показывают (A, C, E) ложноположительные результаты и (B, D, F) ложноотрицательные результаты, определенные с помощью инструментов искусственного интеллекта (ИИ). Все эти примеры были правильно классифицированы в отчетах клинической радиологии. (A) Заднепередняя рентгенограмма грудной клетки у 71-летнего пациента мужского пола, прошедшего обследование в связи с прогрессированием одышки, показывает двусторонний фиброз (стрелки), который был ошибочно классифицирован как заболевание воздушного пространства всеми четырьмя инструментами искусственного интеллекта. (B) Заднепередняя рентгенограмма грудной клетки у 31-летней пациентки, направленной на рентгенографию из-за месячного кашля, показывает незначительное помутнение воздушного пространства на правой границе сердца (стрелки), которое не было замечено всеми инструментами искусственного интеллекта. (C) Переднезадняя рентгенограмма грудной клетки у 78-летнего пациента мужского пола, направленного после установки центрального венозного катетера, показывает кожную складку на правой стороне (стрелка), которую все инструменты AI ошибочно классифицировали как пневмоторакс. (D) Заднепередняя рентгенограмма грудной клетки у 78-летнего пациента мужского пола, направленного для исключения пневмоторакса, показывает очень тонкий апикальный правосторонний пневмоторакс (стрелки), который не был пропущен всеми инструментами искусственного интеллекта, за исключением поставщика B (с высоким порогом чувствительности). . (E) Заднепередняя рентгенограмма грудной клетки у 72-летнего пациента мужского пола, направленного на рентгенографию без уточненной причины, показывает хроническое закругление реберно-диафрагмального угла (стрелка), которое всеми инструментами ИИ было ошибочно принято за плевральный выпот и подтверждено в соответствии с эталонным стандартом. на соответствующем КТ-изображении грудной клетки.

Доктор Плеснер и группа исследователей сравнили эффективность четырех коммерчески доступных инструментов искусственного интеллекта с работой 72 торакальных рентгенологов при интерпретации 2040 последовательных рентгеновских снимков грудной клетки взрослых, сделанных за двухлетний период в четырех датских больницах в 2020 году.

Средний возраст группы пациентов составил 72 года. Из выборки рентгенограмм грудной клетки 669 (32,8%) имели по крайней мере одну целевую находку.

Рентгенограммы грудной клетки оценивались по трем общим признакам: болезни воздушного пространства, пневмотораксу и плевральному выпоту.

Инструменты искусственного интеллекта достигли уровня чувствительности от 72% до 91% для заболеваний воздушного пространства, от 63% до 90% для пневмоторакса и от 62% до 95% для плеврального выпота.

ИИ не готов самостоятельно ставить индивидуальный диагноз

«Инструменты искусственного интеллекта продемонстрировали чувствительность от умеренной до высокой, сравнимую с чувствительностью рентгенологов, при обнаружении заболеваний воздушного пространства, пневмоторакса и плеврального выпота на рентгенограммах грудной клетки», — сказал доктор Плеснер. «Однако они давали больше ложноположительных результатов (прогнозировали заболевание, когда его не было), чем рентгенологи, и их эффективность снижалась при наличии нескольких результатов и для меньших целей».

Для пневмоторакса положительная прогностическая ценность для систем искусственного интеллекта колебалась от 56% до 86% по сравнению с 96% для рентгенологов.

«ИИ хуже всего справляется с выявлением заболеваний воздушного пространства: положительная прогностическая ценность варьируется от 40 до 50%», — сказал доктор Плеснер. «В этой сложной выборке пожилых пациентов ИИ предсказал заболевание воздушного пространства, которого не было в пяти-шести случаях из 10. С такой скоростью система искусственного интеллекта не может работать сама по себе».

По словам доктора Плеснера, цель рентгенологов – сбалансировать возможности обнаружения и исключения заболеваний, избегая как серьезных упущенных из виду заболеваний, так и гипердиагностики.

«Системы искусственного интеллекта кажутся очень хорошими в обнаружении заболеваний, но они не так хороши, как рентгенологи, в выявлении отсутствия заболеваний, особенно когда рентгенограммы грудной клетки сложны», — сказал он. «Слишком много ложноположительных диагнозов приведет к ненужной визуализации, радиационному воздействию и увеличению затрат».

Послушайте, как доктор Плеснер обсуждает свои исследования.

Доктор Плеснер сказал, что большинство исследований, как правило, склонны оценивать способность ИИ определять наличие или отсутствие одного заболевания, что является гораздо более простой задачей, чем реальные сценарии, когда у пациентов наблюдается несколько заболеваний.

«Во многих предыдущих исследованиях, заявлявших о превосходстве ИИ над рентгенологами, рентгенологи просматривали только изображение без доступа к истории болезни пациента и предыдущим исследованиям изображений», — сказал он. «В повседневной практике интерпретация рентгенологом визуализационного исследования представляет собой синтез этих трех точек данных. Мы предполагаем, что следующее поколение инструментов ИИ может стать значительно более мощным, если оно будет способно осуществлять такой синтез, но таких систем пока не существует».

«Наше исследование показывает, что рентгенологи обычно превосходят ИИ в реальных сценариях, когда имеется большое количество пациентов», — сказал он. «Хотя система искусственного интеллекта эффективна при выявлении нормальных рентгенограмм грудной клетки, искусственный интеллект не должен быть автономным для постановки диагноза».

Доктор Плеснер отметил, что эти инструменты искусственного интеллекта могут повысить уверенность рентгенологов в своих диагнозах, предоставив возможность еще раз взглянуть на рентгенограммы грудной клетки.

Источник