Надежность и данные
Природная биомедицинская инженерия (2023 г.) Процитировать эту статью
28 Альтметрика
Подробности о метриках
Модели машинного обучения для медицинских задач могут соответствовать или превосходить работу клинических экспертов. Однако в настройках, отличных от настроек набора обучающих данных, производительность модели может существенно ухудшиться. Здесь мы сообщаем о стратегии обучения представлению моделей машинного обучения, применяемой к задачам медицинской визуализации, которая смягчает такую проблему производительности «вне распределения» и повышает надежность модели и эффективность обучения. Стратегия, которую мы назвали REMEDIS (что означает «Надежная и эффективная медицинская визуализация с самоконтролем»), сочетает в себе крупномасштабное контролируемое переносное обучение на естественных изображениях и промежуточное контрастное самоконтролируемое обучение на медицинских изображениях и требует минимальной настройки для конкретной задачи. Мы показываем полезность REMEDIS в ряде задач диагностической визуализации, охватывающих шесть областей визуализации и 15 наборов тестовых данных, а также путем моделирования трех реалистичных сценариев выхода из-под распределения. REMEDIS повысил точность диагностики внутри распределения до 11,5% по сравнению с сильными контролируемыми базовыми моделями, а в условиях вне распределения требовалось только 1–33% данных для переобучения, чтобы соответствовать производительности контролируемых моделей, переобученных с использованием всех доступных данных. . REMEDIS может ускорить жизненный цикл разработки моделей машинного обучения для медицинской визуализации.
Это предварительный просмотр контента подписки, доступ через ваше учреждение.
Доступ к журналу Nature и 54 другим журналам Nature Portfolio.
Приобретите Nature+, нашу выгодную подписку с онлайн-доступом.
29,99 долларов США / 30 дней
отменить в любое время
Подпишитесь на этот журнал
Получите 12 цифровых выпусков и онлайн-доступ к статьям.
79,00 долларов США в год
всего $6,58 за выпуск
Возьмите напрокат или купите эту статью
Получите только эту статью до тех пор, пока она вам нужна
$39,95
Цены могут зависеть от местных налогов, которые рассчитываются во время оформления заказа.
Наборы данных из больниц Northwestern Medicine и Apollo Hospitals использовались по лицензии для текущего исследования и не являются общедоступными. Заявки на доступ к базе данных Optimam можно подать с помощью этой веб-формы. Обезличенные данные теледерматологии, использованные в этом исследовании, не являются общедоступными из-за ограничений в соглашении об обмене данными. Немаркированный набор данных, используемый для классификации DME, представляет собой обезличенные данные от EyePACS Inc. Заинтересованным исследователям следует связаться с [email protected], чтобы узнать о доступе к данным EyePACS, и обратиться в Управление исследований и разработок, чтобы узнать о доступе к данным VA. Остальные аннотированные данные для задач классификации ID и OOD DME были собраны в больнице Раджавити в Таиланде и в Институте глаза льва и не доступны публично из-за ограничений в соглашении об обмене данными. Данные, используемые при оценке и предварительной подготовке классификации рентгенологических состояний грудной клетки, включая MIMIC-CXR, CheXpert и ChestX-ray 14, общедоступны. Данные, используемые для точной настройки идентификатора и оценки обнаружения метастазов, общедоступны на веб-сайте CAMELYON Challenge. Данные TCGA, используемые для предварительной подготовки как для задач обнаружения метастазов на основе патологии, так и для задач прогнозирования выживаемости, доступны на веб-сайте NIH. Остальные данные, используемые в задачах по патологии, не являются общедоступными из-за ограничений в соглашении об обмене данными. Кроме того, ImageNet-1K (ILSVRC-2012)68, используемый для предварительного обучения базовых контролируемых моделей, и ImageNet-21K, используемый для предварительного обучения моделей BiT-M, общедоступны на веб-сайте ImageNet. Модели BiT-L, обученные на наборе данных JFT-300M54, не являются общедоступными из-за ограничений в соглашении об обмене данными.
Несколько основных компонентов работы доступны в репозиториях с открытым исходным кодом, таких как библиотека T. База кода и предварительно обученные веса, используемые для самостоятельного предварительного обучения, доступны в разделе S. База кода и предварительно обученные веса для моделей BiT доступны в разделе B. Все эксперименты и детали реализации достаточно подробно описаны в разделах «Методы» и «Дополнительная информация для поддержки». репликация с непатентованными библиотеками. База кода, используемая для нашего сравнения с ResNet-RS, была основана на R. Ряд контрольных точек и моделей, созданных с помощью REMEDIS, легко доступны исследователям через P. Кроме того, репозитории Foundation Medical ML на GitHub предлагают доступ к кодам, которые могут использоваться для обучения моделей на базе REMEDIS.