論文の概要: A Textbook Remedy for Domain Shifts: Knowledge Priors for Medical Image Analysis
- arxiv url: http://arxiv.org/abs/2405.14839v2
- Date: Sat, 02 Nov 2024 14:02:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-05 14:44:34.681380
- Title: A Textbook Remedy for Domain Shifts: Knowledge Priors for Medical Image Analysis
- Title(参考訳): ドメインシフトのための教科書治療 : 医用画像解析のための知識優先
- Authors: Yue Yang, Mona Gandhi, Yufei Wang, Yifan Wu, Michael S. Yao, Chris Callison-Burch, James C. Gee, Mark Yatskar,
- Abstract要約: ディープネットワークは、医学的なスキャンに適用すると、例外のない状況で失敗することが多いため、自然画像の解析において広く成功している。
胸部X線や皮膚病変画像の文脈において、異なる病院から採取したデータや、性別、人種などの人口統計学的変数によって構築されたデータなど、ドメインシフトに対するモデル感度に焦点をあてる。
医学教育からインスピレーションを得て,自然言語で伝達される明示的な医学知識を基盤としたディープネットワークを提案する。
- 参考スコア(独自算出の注目度): 48.84443450990355
- License:
- Abstract: While deep networks have achieved broad success in analyzing natural images, when applied to medical scans, they often fail in unexcepted situations. We investigate this challenge and focus on model sensitivity to domain shifts, such as data sampled from different hospitals or data confounded by demographic variables such as sex, race, etc, in the context of chest X-rays and skin lesion images. A key finding we show empirically is that existing visual backbones lack an appropriate prior from the architecture for reliable generalization in these settings. Taking inspiration from medical training, we propose giving deep networks a prior grounded in explicit medical knowledge communicated in natural language. To this end, we introduce Knowledge-enhanced Bottlenecks (KnoBo), a class of concept bottleneck models that incorporates knowledge priors that constrain it to reason with clinically relevant factors found in medical textbooks or PubMed. KnoBo uses retrieval-augmented language models to design an appropriate concept space paired with an automatic training procedure for recognizing the concept. We evaluate different resources of knowledge and recognition architectures on a broad range of domain shifts across 20 datasets. In our comprehensive evaluation with two imaging modalities, KnoBo outperforms fine-tuned models on confounded datasets by 32.4% on average. Finally, evaluations reveal that PubMed is a promising resource for making medical models less sensitive to domain shift, outperforming other resources on both diversity of information and final prediction performance.
- Abstract(参考訳): ディープ・ネットワークは、自然画像の解析において幅広い成功を収めてきたが、医学的なスキャンに適用すると、例外なく失敗することが多い。
胸部X線や皮膚病変画像の文脈において、異なる病院から採取したデータや、性別、人種などの人口統計学的変数によって構築されたデータなど、ドメインシフトに対するモデル感度に焦点をあてる。
私たちが経験的に示した重要な発見は、既存の視覚バックボーンは、これらの設定における信頼性の高い一般化のために、アーキテクチャから適切な事前を欠いていることである。
医学教育からインスピレーションを得て,自然言語で伝達される明示的な医学知識を基盤としたディープネットワークを提案する。
この目的のために我々は、医学教科書やPubMedで見られる臨床的に関連性のある要因による推論を制約する知識優先を組み込んだ概念ボトルネックモデルであるKnoBo(Knowledge-enhanced Bottlenecks)を導入する。
KnoBoは、検索拡張言語モデルを使用して、概念を認識するための自動トレーニング手順と組み合わせた適切な概念空間を設計する。
知識と認識アーキテクチャの異なるリソースを、20のデータセットにわたる幅広いドメインシフトに基づいて評価する。
2つの画像モダリティによる包括的な評価では、KnoBoは、統合データセット上の微調整されたモデルを平均32.4%上回っている。
最後に、PubMedはドメインシフトに敏感な医療モデルを実現するための有望なリソースであり、情報の多様性と最終的な予測性能の両方において、他のリソースよりも優れています。
関連論文リスト
- Medical Vision-Language Pre-Training for Brain Abnormalities [96.1408455065347]
本稿では,PubMedなどの公共リソースから,医用画像・テキスト・アライメントデータを自動的に収集する方法を示す。
特に,まず大きな脳画像テキストデータセットを収集することにより,事前学習プロセスの合理化を図るパイプラインを提案する。
また,医療領域におけるサブフィギュアをサブキャプションにマッピングするというユニークな課題についても検討した。
論文 参考訳(メタデータ) (2024-04-27T05:03:42Z) - Knowledge-enhanced Visual-Language Pretraining for Computational Pathology [68.6831438330526]
本稿では,公共資源から収集した大規模画像テキストペアを利用した視覚的表現学習の課題について考察する。
ヒト32組織から病理診断を必要とする4,718の疾患に対して50,470個の情報属性からなる病理知識ツリーをキュレートする。
論文 参考訳(メタデータ) (2024-04-15T17:11:25Z) - Robust and Interpretable Medical Image Classifiers via Concept
Bottleneck Models [49.95603725998561]
本稿では,自然言語の概念を用いた堅牢で解釈可能な医用画像分類器を構築するための新しいパラダイムを提案する。
具体的には、まず臨床概念をGPT-4から検索し、次に視覚言語モデルを用いて潜在画像の特徴を明示的な概念に変換する。
論文 参考訳(メタデータ) (2023-10-04T21:57:09Z) - Evaluation of Various Open-Set Medical Imaging Tasks with Deep Neural
Networks [15.655519786176438]
我々は最先端のオープンセット手法の厳密な評価を行い、異なるオープンセットシナリオを探索する。
一般領域学習モデルと医療領域学習モデルの主な違いを示す。
論文 参考訳(メタデータ) (2021-10-21T04:19:41Z) - Deep Co-Attention Network for Multi-View Subspace Learning [73.3450258002607]
マルチビューサブスペース学習のための深層コアテンションネットワークを提案する。
共通情報と相補情報の両方を敵意で抽出することを目的としている。
特に、新しいクロス再構成損失を使用し、ラベル情報を利用して潜在表現の構築を誘導する。
論文 参考訳(メタデータ) (2021-02-15T18:46:44Z) - A survey on shape-constraint deep learning for medical image
segmentation [0.46023882211671957]
畳み込みニューラルネットワークとその多くのバリエーションは、ディープラーニングベースの医療画像セグメンテーションの現代の風景を完全に変えました。
これらの手法のピクセルレベルの分類と回帰に対する過度の依存は、問題として早期に特定されている。
セグメンテーション結果が解剖学的に一貫性があることを確認するために、マルコフ/条件付きランダムフィールドに基づくアプローチは、統計的シェイプモデルがますます普及しています。
論文 参考訳(メタデータ) (2021-01-19T16:52:10Z) - Medical Image Harmonization Using Deep Learning Based Canonical Mapping:
Toward Robust and Generalizable Learning in Imaging [4.396671464565882]
多様な取得条件のデータを共通参照領域に"調和"する新しいパラダイムを提案する。
我々は,MRIによる脳年齢予測と統合失調症の分類という,2つの問題に対して本手法を検証した。
論文 参考訳(メタデータ) (2020-10-11T22:01:37Z) - Domain Generalization for Medical Imaging Classification with
Linear-Dependency Regularization [59.5104563755095]
本稿では,医用画像分類分野におけるディープニューラルネットワークの一般化能力向上のための,シンプルだが効果的なアプローチを提案する。
医用画像の領域変数がある程度コンパクトであることに感銘を受けて,変分符号化による代表的特徴空間の学習を提案する。
論文 参考訳(メタデータ) (2020-09-27T12:30:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。