Надежность и данные

Природная биомедицинская инженерия (2023 г.) Процитировать эту статью

28 Альтметрика

Подробности о метриках

Модели машинного обучения для медицинских задач могут соответствовать или превосходить работу клинических экспертов. Однако в настройках, отличных от настроек набора обучающих данных, производительность модели может существенно ухудшиться. Здесь мы сообщаем о стратегии обучения представлению моделей машинного обучения, применяемой к задачам медицинской визуализации, которая смягчает такую проблему производительности «вне распределения» и повышает надежность модели и эффективность обучения. Стратегия, которую мы назвали REMEDIS (что означает «Надежная и эффективная медицинская визуализация с самоконтролем»), сочетает в себе крупномасштабное контролируемое переносное обучение на естественных изображениях и промежуточное контрастное самоконтролируемое обучение на медицинских изображениях и требует минимальной настройки для конкретной задачи. Мы показываем полезность REMEDIS в ряде задач диагностической визуализации, охватывающих шесть областей визуализации и 15 наборов тестовых данных, а также путем моделирования трех реалистичных сценариев выхода из-под распределения. REMEDIS повысил точность диагностики внутри распределения до 11,5% по сравнению с сильными контролируемыми базовыми моделями, а в условиях вне распределения требовалось только 1–33% данных для переобучения, чтобы соответствовать производительности контролируемых моделей, переобученных с использованием всех доступных данных. . REMEDIS может ускорить жизненный цикл разработки моделей машинного обучения для медицинской визуализации.

Это предварительный просмотр контента подписки, доступ через ваше учреждение.

Доступ к журналу Nature и 54 другим журналам Nature Portfolio.

Приобретите Nature+, нашу выгодную подписку с онлайн-доступом.

29,99 долларов США / 30 дней

отменить в любое время

Подпишитесь на этот журнал

Получите 12 цифровых выпусков и онлайн-доступ к статьям.

79,00 долларов США в год

всего $6,58 за выпуск

Возьмите напрокат или купите эту статью

Получите только эту статью до тех пор, пока она вам нужна

$39,95

Цены могут зависеть от местных налогов, которые рассчитываются во время оформления заказа.

Наборы данных из больниц Northwestern Medicine и Apollo Hospitals использовались по лицензии для текущего исследования и не являются общедоступными. Заявки на доступ к базе данных Optimam можно подать с помощью этой веб-формы. Обезличенные данные теледерматологии, использованные в этом исследовании, не являются общедоступными из-за ограничений в соглашении об обмене данными. Немаркированный набор данных, используемый для классификации DME, представляет собой обезличенные данные от EyePACS Inc. Заинтересованным исследователям следует связаться с [email protected], чтобы узнать о доступе к данным EyePACS, и обратиться в Управление исследований и разработок, чтобы узнать о доступе к данным VA. Остальные аннотированные данные для задач классификации ID и OOD DME были собраны в больнице Раджавити в Таиланде и в Институте глаза льва и не доступны публично из-за ограничений в соглашении об обмене данными. Данные, используемые при оценке и предварительной подготовке классификации рентгенологических состояний грудной клетки, включая MIMIC-CXR, CheXpert и ChestX-ray 14, общедоступны. Данные, используемые для точной настройки идентификатора и оценки обнаружения метастазов, общедоступны на веб-сайте CAMELYON Challenge. Данные TCGA, используемые для предварительной подготовки как для задач обнаружения метастазов на основе патологии, так и для задач прогнозирования выживаемости, доступны на веб-сайте NIH. Остальные данные, используемые в задачах по патологии, не являются общедоступными из-за ограничений в соглашении об обмене данными. Кроме того, ImageNet-1K (ILSVRC-2012)68, используемый для предварительного обучения базовых контролируемых моделей, и ImageNet-21K, используемый для предварительного обучения моделей BiT-M, общедоступны на веб-сайте ImageNet. Модели BiT-L, обученные на наборе данных JFT-300M54, не являются общедоступными из-за ограничений в соглашении об обмене данными.

Несколько основных компонентов работы доступны в репозиториях с открытым исходным кодом, таких как библиотека T. База кода и предварительно обученные веса, используемые для самостоятельного предварительного обучения, доступны в разделе S. База кода и предварительно обученные веса для моделей BiT доступны в разделе B. Все эксперименты и детали реализации достаточно подробно описаны в разделах «Методы» и «Дополнительная информация для поддержки». репликация с непатентованными библиотеками. База кода, используемая для нашего сравнения с ResNet-RS, была основана на R. Ряд контрольных точек и моделей, созданных с помощью REMEDIS, легко доступны исследователям через P. Кроме того, репозитории Foundation Medical ML на GitHub предлагают доступ к кодам, которые могут использоваться для обучения моделей на базе REMEDIS.

Новости