論文の概要: Learning to Generalize towards Unseen Domains via a Content-Aware Style
Invariant Model for Disease Detection from Chest X-rays
- arxiv url: http://arxiv.org/abs/2302.13991v2
- Date: Wed, 23 Aug 2023 09:27:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-24 18:28:37.955862
- Title: Learning to Generalize towards Unseen Domains via a Content-Aware Style
Invariant Model for Disease Detection from Chest X-rays
- Title(参考訳): 胸部X線による疾患検出のためのコンテンツ認識型不変モデルによる未確認領域への一般化の学習
- Authors: Mohammad Zunaed, Md. Aynal Haque, Taufiq Hasan
- Abstract要約: CXR画像からの病理診断のための医用画像では、モデルはスタイル不変で内容バイアスのあるドメイン不変の特徴を抽出する必要がある。
我々は、画像と特徴レベルの両方で新しいスタイルランダム化モジュール(SRM)を用いて、リッチなスタイルの摂動特徴をその場で生成する。
提案するフレームワークは、ドメインシフトの存在下でより堅牢で、最先端のパフォーマンスを実現する。
- 参考スコア(独自算出の注目度): 2.2835858158799405
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Performance degradation due to source domain mismatch is a longstanding
challenge in deep learning-based medical image analysis, particularly for chest
X-rays (CXRs). Several methods (e.g., adversarial training, multi-domain
mixups) have been proposed to extract domain-invariant high-level features to
address this domain shift. However, these methods do not explicitly regularize
the content and style characteristics of the extracted domain-invariant
features. Recent studies have demonstrated that CNN models exhibit a strong
bias toward styles (e.g., uninformative textures) rather than content (e.g.,
shape), in stark contrast to the human-vision system. Radiologists tend to
learn visual cues from CXRs and thus perform well across multiple domains.
Therefore, in medical imaging for pathology diagnosis from CXR images, models
should extract domain-invariant features that are style-invariant and
content-biased. Motivated by this, we employ the novel style randomization
modules (SRMs) at both image and feature levels that work together
hierarchically to create rich style perturbed features on the fly while keeping
the content intact. In addition, we leverage consistency regularizations
between global semantic features and predicted probability distributions,
respectively, for with and without style perturbed versions of the same CXR
image to tweak the model's sensitivity toward content markers for accurate
predictions. Extensive experiments with three large-scale thoracic disease
datasets, i.e., CheXpert, MIMIC-CXR, and BRAX, demonstrate that our proposed
framework is more robust in the presence of domain shift and achieves
state-of-the-art performance.
- Abstract(参考訳): ソースドメインミスマッチによるパフォーマンス劣化は、特に胸部X線(CXR)の深層学習に基づく医用画像解析における長年にわたる課題である。
ドメインシフトに対応するために、ドメイン不変な高レベル特徴を抽出するいくつかの方法(例えば、逆トレーニング、マルチドメイン混合)が提案されている。
しかし、これらの手法は抽出されたドメイン不変特徴の内容やスタイル特性を明示的に定式化しない。
近年の研究では、cnnモデルが人間の視覚システムとは対照的に、コンテンツ(例えば形状)よりもスタイル(例えば、非形成テクスチャ)に対して強いバイアスを示すことが示されている。
放射線学者は、CXRから視覚的手がかりを学び、複数の領域でよく機能する傾向にある。
したがって、cxr画像から病理診断のための医用イメージングでは、モデルはスタイル不変で内容バイアスのあるドメイン不変な特徴を抽出する必要がある。
そこで我々は,画像と特徴の両レベルで新しいスタイルランダム化モジュール(SRM)を採用し,階層的に協調してリッチなスタイルの摂動機能を作成しながら,コンテンツをそのまま維持する。
さらに,同一のcxr画像のスタイル摂動バージョンに対して,グローバルセマンティクス特徴と予測確率分布との一貫性の正規化をそれぞれ活用し,正確な予測のためにコンテンツマーカーに対するモデルの感度を調整した。
大規模胸部疾患データセットであるCheXpert,MIMIC-CXR,BRAXを用いた大規模な実験により,本フレームワークはドメインシフトの存在下でより堅牢であり,最先端のパフォーマンスを実現することができることを示した。
関連論文リスト
- CROCODILE: Causality aids RObustness via COntrastive DIsentangled LEarning [8.975676404678374]
CROCODILEフレームワークを導入し、因果関係のツールがモデルの堅牢性からドメインシフトを育む方法を示します。
我々はCXRの多ラベル肺疾患分類に750万枚以上の画像を用いて本手法を適用した。
論文 参考訳(メタデータ) (2024-08-09T09:08:06Z) - Adaptive Face Recognition Using Adversarial Information Network [57.29464116557734]
顔認識モデルは、トレーニングデータがテストデータと異なる場合、しばしば退化する。
本稿では,新たな敵情報ネットワーク(AIN)を提案する。
論文 参考訳(メタデータ) (2023-05-23T02:14:11Z) - SFHarmony: Source Free Domain Adaptation for Distributed Neuroimaging
Analysis [2.371982686172067]
異なるMRIスキャナーは、異なる特徴を持つ画像を生成し、調和問題として知られる領域シフトをもたらす」。
本研究では、これらの障壁を克服するために、SFHarmony法(Unsupervised Source-Free Domain Adaptation, SFDA)を提案する。
我々の手法は、さまざまな現実的なデータシナリオにおいて、既存のSFDAアプローチよりも優れています。
論文 参考訳(メタデータ) (2023-03-28T13:35:10Z) - Advancing Radiograph Representation Learning with Masked Record Modeling [52.04899592688968]
我々は2つの相補的な目的として自己と報告の補完を定式化し、マスク付きレコードモデリング(MRM)に基づく統一的な枠組みを提案する。
MRMは、知識強化されたセマンティック表現を学ぶためのマルチタスクスキームに従って、マスクされた画像パッチとマスクされたレポートトークンを再構築する。
具体的には、MRMはラベル効率の良い微調整において優れた性能を提供する。
論文 参考訳(メタデータ) (2023-01-30T18:33:32Z) - Improving Classification Model Performance on Chest X-Rays through Lung
Segmentation [63.45024974079371]
本稿では, セグメンテーションによる異常胸部X線(CXR)識別性能を向上させるための深層学習手法を提案する。
提案手法は,CXR画像中の肺領域を局所化するための深層ニューラルネットワーク(XLSor)と,大規模CXRデータセットで事前学習した自己教師あり運動量コントラスト(MoCo)モデルのバックボーンを用いたCXR分類モデルである。
論文 参考訳(メタデータ) (2022-02-22T15:24:06Z) - A Comprehensive Study of Image Classification Model Sensitivity to
Foregrounds, Backgrounds, and Visual Attributes [58.633364000258645]
このデータセットをRIVAL10と呼びます。
本研究では,前景,背景,属性の騒音劣化に対する幅広いモデルの感度を評価する。
本稿では,多種多様な最先端アーキテクチャ (ResNets, Transformers) とトレーニング手順 (CLIP, SimCLR, DeiT, Adversarial Training) について考察する。
論文 参考訳(メタデータ) (2022-01-26T06:31:28Z) - Transfer Learning with Ensembles of Deep Neural Networks for Skin Cancer
Classification in Imbalanced Data Sets [0.6802401545890961]
医療画像から皮膚癌を正確に分類するための機械学習技術が報告されている。
多くのテクニックは、訓練済みの畳み込みニューラルネットワーク(CNN)に基づいており、限られたトレーニングデータに基づいてモデルをトレーニングすることができる。
本稿では,複数のcnnモデルが事前学習され,一部は手元のデータのみにトレーニングされ,患者情報(メタデータ)はメタリーナーを用いて結合される,新しいアンサンブルベースのcnnアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-03-22T06:04:45Z) - Adapt Everywhere: Unsupervised Adaptation of Point-Clouds and Entropy
Minimisation for Multi-modal Cardiac Image Segmentation [10.417009344120917]
マルチモーダル心臓画像分割のための新しいUDA法を提案する。
提案手法は、逆学習に基づいて、異なる空間におけるソースとターゲットドメイン間のネットワーク特徴を適応する。
本手法はannotated source domainからunannotated target domainへの適応により2つの心データセットで検証した。
論文 参考訳(メタデータ) (2021-03-15T08:59:44Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Chest x-ray automated triage: a semiologic approach designed for
clinical implementation, exploiting different types of labels through a
combination of four Deep Learning architectures [83.48996461770017]
本研究では,異なる畳み込みアーキテクチャの後期融合に基づく深層学習手法を提案する。
公開胸部x線画像と機関アーカイブを組み合わせたトレーニングデータセットを4つ構築した。
4つの異なるディープラーニングアーキテクチャをトレーニングし、それらのアウトプットとレイトフュージョン戦略を組み合わせることで、統一されたツールを得ました。
論文 参考訳(メタデータ) (2020-12-23T14:38:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。