論文の概要: Motion-Guided Causal Disentanglement for Robust Multi-View Cine Cardiac MRI Diagnosis
- arxiv url: http://arxiv.org/abs/2606.04414v1
- Date: Wed, 03 Jun 2026 03:45:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.524742
- Title: Motion-Guided Causal Disentanglement for Robust Multi-View Cine Cardiac MRI Diagnosis
- Title(参考訳): ロバスト多視点心磁図診断における運動誘導型因果性遠心術
- Authors: Chuankai Xu, Cristiane De Carvalho Singulane, Mohammad Abuannadi, Stephen Chandler, Jeremy Slivnick, Karolina Zareba, Jane Cao, Vidya Nadig, Fabio Fernandes, Seth Uretsky, Diego Perez de Arenaza, Amit Patel, Jianxin Xie,
- Abstract要約: 本稿では,ViT-MAEバックボーン上に構築したMoViDフレームワークを提案する。
プライベートな臨床静脈血栓症データセットと2つの公開ベンチマークの枠組みについて検討した。
- 参考スコア(独自算出の注目度): 0.4638331367650009
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-view cardiac magnetic resonance (CMR) imaging provides complementary anatomical information and is widely used for noninvasive disease assessment. Recent transformer-based models have demonstrated strong representation learning capabilities for CMR analysis; however, they typically learn unified latent embeddings that entangle view-specific anatomical variations with disease-related features. Such entanglement biases classifiers toward structural attributes rather than view-invariant pathological patterns. This issue is exacerbated in low-data regimes, particularly for underrepresented cardiac conditions, where limited samples increase the susceptibility to shortcut learning and view-dependent decision boundaries. To address this, we propose a Motion-Guided View--Disease Disentanglement framework MoViD built upon a ViT-MAE backbone. The model explicitly factorizes latent representations into view-specific and disease-discriminative components using dual-branch supervised contrastive objectives and a gradient-reversal adversarial constraint that minimizes disease leakage into the view embedding. Additionally, an annotation-free temporal motion feature, derived from inter-frame difference maps, is introduced to localize the beating heart region and suppress background artifacts. A focal reweighting mechanism is incorporated into the contrastive loss to mitigate class imbalance. We evaluate the framework on a private clinical venous thrombosis dataset and two public benchmarks (M&Ms, M&Ms2). Across disease classification and cardiac segmentation tasks, our approach consistently outperforms standard transformer baselines and demonstrates competitive performance against large-scale pretrained foundation models, validating the efficacy of structural disentanglement in medical image analysis.
- Abstract(参考訳): マルチビュー心磁気共鳴 (Multi-view heartc magnetic resonance, CMR) 画像は相補的な解剖学的情報を提供し、非侵襲的疾患評価に広く用いられている。
最近のトランスフォーマーベースモデルでは、CMR解析に強力な表現学習能力が示されているが、一般的には、ビュー固有の解剖学的変異と疾患に関連する特徴とを絡める、統合された潜伏埋め込みを学習する。
このような絡み合いは、ビュー不変の病理パターンよりも構造的属性に対する分類器に偏っている。
この問題は低データ体制、特に、限られたサンプルが学習のショートカットやビュー依存の意思決定境界に対する感受性を増大させる、貧弱な心臓状態において悪化している。
そこで我々は,ViT-MAEのバックボーン上に構築されたMoViDフレームワークのMoViDを提案する。
このモデルは、遅延表現をビュー固有および疾患識別コンポーネントに明確に分解し、デュアルブランチが監督するコントラスト目的と、ビュー埋め込みへの病気の漏洩を最小限に抑える勾配逆方向の逆方向の制約を用いる。
さらに、フレーム間の差分マップから派生したアノテーションのない時間運動特徴を導入し、拍動する心臓領域を局在させ、背景アーティファクトを抑制する。
焦点再重み付け機構をコントラスト損失に組み込んでクラス不均衡を緩和する。
臨床用静脈血栓症データセットと2つのベンチマーク(M&Ms, M&Ms2)について検討した。
本手法は, 疾患分類や心臓セグメンテーションのタスク全体にわたって, 標準トランスフォーマーベースラインを一貫して上回り, 大規模事前学習基盤モデルと競合する性能を示し, 医用画像解析における構造的ゆがみの有効性を検証した。
関連論文リスト
- Anatomy-Aware Unsupervised Detection and Localization of Retinal Abnormalities in Optical Coherence Tomography [4.828654519487229]
教師なしの異常検出フレームワークは、病変のアノテーションなしで正常な網膜解剖の規範的な分布を学習する。
網膜層を意識した3重項学習と構造的三重項学習を併用し,病的表現と健康的表現を分離する。
Kermany データセット (AUROC: 0.799) では,VAE, VQVAE, VQGAN, f-AnoGAN ベースラインを大幅に上回っている。
論文 参考訳(メタデータ) (2026-04-24T01:09:05Z) - Delving Aleatoric Uncertainty in Medical Image Segmentation via Vision Foundation Models [56.29123284262618]
本研究は,視覚基盤モデルの普遍的表現能力を生かして固有データ不確実性を推定することを提案する。
モデルのデコード表現の特徴の多様性を分析し,その特異値エネルギーを定量化し,各クラスに対する意味知覚尺度を定義する。
この基礎に基づいて,本研究は,(1)潜在的にノイズの多いサンプルを排除し,モデル学習品質を向上させるためのアレータリック不確実性認識データフィルタリング機構,(2)意味認識尺度に基づくトレーニング中にクラス固有の損失重みを適応的に調整する動的不確実性認識最適化戦略,およびトレーニング安定性を向上させるラベル認知機構の2つの不確実性駆動型アプリケーション戦略を設計する。
論文 参考訳(メタデータ) (2026-04-13T03:59:54Z) - Clinical Cognition Alignment for Gastrointestinal Diagnosis with Multimodal LLMs [63.535652574541764]
MLLM(Multimodal Large Language Models)は医用画像解析において顕著な可能性を示した。
消化器内視鏡におけるそれらの応用は、現在、2つの重要な限界によって妨げられている。
本稿では,これらの課題に対処する新しい臨床認知アライメント(CogAlign)フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-21T07:47:37Z) - Context-Aware Asymmetric Ensembling for Interpretable Retinopathy of Prematurity Screening via Active Query and Vascular Attention [1.8420107091891775]
未熟児網膜症(ROP:Retinopathy of Prematurity)は、小児期盲症の主要な原因の一つである。
現在のディープラーニングモデルは、大きなプライベートデータセットとパッシブマルチモーダル融合に大きく依存している。
本研究では,2つの専門ストリームによる臨床推論をシミュレートする文脈認識非対称アンサンブルモデル(CAAアンサンブル)を提案する。
論文 参考訳(メタデータ) (2026-02-05T02:06:26Z) - Multi-View Stenosis Classification Leveraging Transformer-Based Multiple-Instance Learning Using Real-World Clinical Data [76.89269238957593]
冠動脈狭窄は心血管疾患の主要な原因であり,多発血管造影で冠動脈を解析し診断した。
患者レベルの狭窄分類のためのトランスフォーマーベースマルチビューマルチインスタンス学習フレームワークであるSegmentMILを提案する。
論文 参考訳(メタデータ) (2026-02-02T13:07:52Z) - Structure-constrained Language-informed Diffusion Model for Unpaired Low-dose Computed Tomography Angiography Reconstruction [72.80209358480424]
ヨウ素化コントラスト培地(ICM)の過剰摂取は、腎臓の損傷と致命的なアレルギー反応を引き起こす。
深層学習法は、低線量ICMから正常線量ICMのCT画像を生成することができ、必要な線量を減らすことができる。
本研究では,構造シナジーと空間知性を統合した構造制約型言語情報拡散モデル(SLDM)を提案する。
論文 参考訳(メタデータ) (2026-01-28T06:54:06Z) - A Semantically Enhanced Generative Foundation Model Improves Pathological Image Synthesis [82.01597026329158]
本稿では,組織合成のための相関調整フレームワーク(CRAFTS)について紹介する。
CRAFTSは、生物学的精度を確保するためにセマンティックドリフトを抑制する新しいアライメント機構を組み込んでいる。
本モデルは,30種類の癌にまたがる多彩な病理像を生成する。
論文 参考訳(メタデータ) (2025-12-15T10:22:43Z) - Proof of Concept for Mammography Classification with Enhanced Compactness and Separability Modules [0.0]
本研究では,最近の医用画像分類手法の検証と拡張について述べる。
Inbreast、MIAS、InceptionMのマンモグラフィコレクションを統合したKaggleデータセットを使用して、ベースラインのCNN、ConvNeXt Tiny、InceptionV3のバックボーンをGAGMとSEモジュールで強化したものだ。
その結果, GAGMとSEが特徴識別性を高め, 偽陰性を低下させる効果が確認された。
しかし,本実験では,マンモグラフィの分類条件下において,特徴平滑化損失は測定不可能な改善を得られなかった。
論文 参考訳(メタデータ) (2025-12-06T21:36:05Z) - Structure and Smoothness Constrained Dual Networks for MR Bias Field Correction [6.078318492288723]
MR画像改善のためのディープラーニングモデルが提案されている。
S2DNetは自己監督バイアス場補正を目的として提案されている。
臨床およびシミュレーションされたMRデータセットの実験は、提案モデルが他の従来型およびディープラーニングベースモデルより優れていることを示している。
論文 参考訳(メタデータ) (2025-07-02T03:23:43Z) - Unsupervised contrastive analysis for anomaly detection in brain MRIs via conditional diffusion models [13.970483987621135]
本研究では、健康な画像に対して自己教師付きコントラストエンコーダを訓練することにより、再建品質を改善するための教師なしフレームワークを提案する。
これらの特徴は、拡散モデルを用いて、与えられた画像の健全な外観を再構成し、画素ワイド比較による解釈可能な異常な局所化を可能にする。
論文 参考訳(メタデータ) (2024-06-02T15:19:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。