論文の概要: RoentMod: A Synthetic Chest X-Ray Modification Model to Identify and Correct Image Interpretation Model Shortcuts
- arxiv url: http://arxiv.org/abs/2509.08640v1
- Date: Wed, 10 Sep 2025 14:35:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-11 15:16:52.457876
- Title: RoentMod: A Synthetic Chest X-Ray Modification Model to Identify and Correct Image Interpretation Model Shortcuts
- Title(参考訳): RoentMod: 画像解釈モデルショートカットの同定と修正のための合成胸部X線修正モデル
- Authors: Lauren H. Cooke, Matthias Jung, Jan M. Brendel, Nora M. Kerkovits, Borek Foldyna, Michael T. Lu, Vineet K. Raghu,
- Abstract要約: 胸部X線写真(CXR)は医学で最も一般的な検査である。
深層学習マルチタスクと基礎モデルにより,CXR解釈の性能が向上した。
本稿では,反ファクト画像編集フレームワークであるRoentModを紹介する。
- 参考スコア(独自算出の注目度): 0.48861336570452174
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Chest radiographs (CXRs) are among the most common tests in medicine. Automated image interpretation may reduce radiologists\' workload and expand access to diagnostic expertise. Deep learning multi-task and foundation models have shown strong performance for CXR interpretation but are vulnerable to shortcut learning, where models rely on spurious and off-target correlations rather than clinically relevant features to make decisions. We introduce RoentMod, a counterfactual image editing framework that generates anatomically realistic CXRs with user-specified, synthetic pathology while preserving unrelated anatomical features of the original scan. RoentMod combines an open-source medical image generator (RoentGen) with an image-to-image modification model without requiring retraining. In reader studies with board-certified radiologists and radiology residents, RoentMod-produced images appeared realistic in 93\% of cases, correctly incorporated the specified finding in 89-99\% of cases, and preserved native anatomy comparable to real follow-up CXRs. Using RoentMod, we demonstrate that state-of-the-art multi-task and foundation models frequently exploit off-target pathology as shortcuts, limiting their specificity. Incorporating RoentMod-generated counterfactual images during training mitigated this vulnerability, improving model discrimination across multiple pathologies by 3-19\% AUC in internal validation and by 1-11\% for 5 out of 6 tested pathologies in external testing. These findings establish RoentMod as a broadly applicable tool for probing and correcting shortcut learning in medical AI. By enabling controlled counterfactual interventions, RoentMod enhances the robustness and interpretability of CXR interpretation models and provides a generalizable strategy for improving foundation models in medical imaging.
- Abstract(参考訳): 胸部X線写真(CXR)は医学で最も一般的な検査である。
自動画像解釈は、放射線技師の作業量を減らし、診断の専門知識へのアクセスを拡大する。
深層学習のマルチタスクと基礎モデルでは、CXR解釈の性能は高いが、学習のショートカットには弱い。
本稿では, 解剖学的にリアルなCXRをユーザ指定の合成病理で生成する反ファクト画像編集フレームワークであるRoentModを紹介し, 元のスキャンの非関係な解剖学的特徴を保存している。
RoentModは、オープンソースの医療画像生成器(RoentGen)と画像から画像への修正モデルを組み合わせたもので、再トレーニングは不要である。
放射線技師や放射線技師らによる調査では,99%の症例でRoentMod生成画像が現実的に出現し,89~99%の症例で特定所見を正しく取り入れ,CXRに匹敵する自然解剖を保存した。
RoentModを用いて、最先端のマルチタスクモデルと基礎モデルが、標的外病理をしばしばショートカットとして利用し、その特異性を制限していることを示す。
トレーニング中にRoentModの生成した反ファクトイメージを組み込むことで、この脆弱性が軽減され、内部検証ではAUCが3-19\%、外部テストでは6つのうち5つが1-11\%のモデル判別が改善された。
これらの知見は、医療AIにおけるショートカット学習を探索し、修正するための広く適用可能なツールとして、RoentModを確立している。
制御された対物介入を有効にすることにより、RoentModはCXR解釈モデルの堅牢性と解釈可能性を高め、医用画像の基礎モデルを改善するための一般化可能な戦略を提供する。
関連論文リスト
- An autonomous agent for auditing and improving the reliability of clinical AI models [11.225863068085266]
本稿では,ユーザと対話する自己表現型エージェントであるModelAuditorを紹介する。
ModelAuditorはコンテキストに依存し、臨床的に関連する分布シフトをシミュレートする。
そして、デプロイ中にパフォーマンスがどの程度低下するかを説明する解釈可能なレポートを生成する。
論文 参考訳(メタデータ) (2025-07-08T07:58:52Z) - RadFabric: Agentic AI System with Reasoning Capability for Radiology [61.25593938175618]
RadFabricは、総合的なCXR解釈のための視覚的およびテキスト分析を統合するマルチエージェント、マルチモーダル推論フレームワークである。
システムは、病理診断に特殊なCXRエージェント、正確な解剖学的構造に視覚所見をマッピングする解剖学的解釈エージェント、および視覚的、解剖学的、臨床データを透明かつ証拠に基づく診断に合成する大規模なマルチモーダル推論モデルを利用した推論エージェントを使用する。
論文 参考訳(メタデータ) (2025-06-17T03:10:33Z) - Anatomy-Grounded Weakly Supervised Prompt Tuning for Chest X-ray Latent Diffusion Models [8.94567513238762]
標準テキスト条件付潜時拡散モデルでは, 対象スキャンの対応する領域と, 臨床上の関連情報が一致しないことが示されている。
句接地のような下流のタスクに効率的に再利用できるように,事前訓練されたモデルにおけるマルチモーダルアライメントを改善するための微調整フレームワークを提案する。
論文 参考訳(メタデータ) (2025-06-12T12:19:18Z) - Latent Drifting in Diffusion Models for Counterfactual Medical Image Synthesis [55.959002385347645]
遅延ドリフトにより、医療画像に対して拡散モデルを条件付けし、反ファクト画像生成の複雑なタスクに適合させることができる。
我々は,脳MRIと胸部X線による3つの時系列的ベンチマークデータセットを用いて,対物画像生成法について検討した。
論文 参考訳(メタデータ) (2024-12-30T01:59:34Z) - A foundation model for generalizable disease diagnosis in chest X-ray images [40.9095393430871]
CXRBaseは,非ラベリングなCXR画像から多目的表現を学習するための基礎モデルである。
CXRBaseは1.04百万の未ラベルのCXRイメージのデータセットでトレーニングされている。
ラベル付きデータで微調整され、疾患検出の性能を高める。
論文 参考訳(メタデータ) (2024-10-11T14:41:27Z) - CROCODILE: Causality aids RObustness via COntrastive DIsentangled LEarning [8.975676404678374]
CROCODILEフレームワークを導入し、因果関係のツールがモデルの堅牢性からドメインシフトを育む方法を示します。
我々はCXRの多ラベル肺疾患分類に750万枚以上の画像を用いて本手法を適用した。
論文 参考訳(メタデータ) (2024-08-09T09:08:06Z) - Diffusion Models for Counterfactual Generation and Anomaly Detection in Brain Images [39.94162291765236]
病気の画像の健全なバージョンを生成し,それを用いて画素単位の異常マップを得るための弱教師付き手法を提案する。
健常者を対象にした拡散モデルを用いて, サンプリングプロセスの各ステップで拡散拡散確率モデル (DDPM) と拡散拡散確率モデル (DDIM) を組み合わせる。
論文 参考訳(メタデータ) (2023-08-03T21:56:50Z) - On Sensitivity and Robustness of Normalization Schemes to Input
Distribution Shifts in Automatic MR Image Diagnosis [58.634791552376235]
深層学習(DL)モデルは、再構成画像を入力として、複数の疾患の診断において最先端のパフォーマンスを達成した。
DLモデルは、トレーニングとテストフェーズ間の入力データ分布の変化につながるため、さまざまなアーティファクトに敏感である。
本稿では,グループ正規化やレイヤ正規化といった他の正規化手法を用いて,画像のさまざまなアーチファクトに対して,モデル性能にロバスト性を注入することを提案する。
論文 参考訳(メタデータ) (2023-06-23T03:09:03Z) - Cross-Modal Causal Intervention for Medical Report Generation [107.76649943399168]
放射線医学報告生成(RRG)は, コンピュータ支援診断と薬剤指導に不可欠である。
視覚言語的バイアスによる急激な相関により、正確な病変記述の生成は依然として困難である。
我々はCrossModal Causal Representation Learning (CMCRL)という2段階のフレームワークを提案する。
IU-XrayとMIMIC-CXRの実験により、我々のCMCRLパイプラインは最先端の手法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2023-03-16T07:23:55Z) - Adapting Pretrained Vision-Language Foundational Models to Medical
Imaging Domains [3.8137985834223502]
臨床の文脈を忠実に描写する医療画像の生成モデルを構築することは、医療データセットの不明瞭さを軽減するのに役立つ。
安定拡散パイプラインのサブコンポーネントを探索し、モデルを微調整して医用画像を生成する。
我々の最良の性能モデルは、安定な拡散ベースラインを改善し、合成ラジオグラフィ画像に現実的な異常を挿入するように条件付けすることができる。
論文 参考訳(メタデータ) (2022-10-09T01:43:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。