論文の概要: Robust Multimodal Representation Learning in Healthcare
- arxiv url: http://arxiv.org/abs/2601.21941v1
- Date: Thu, 29 Jan 2026 16:27:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-30 16:22:49.989029
- Title: Robust Multimodal Representation Learning in Healthcare
- Title(参考訳): 医療におけるロバストなマルチモーダル表現学習
- Authors: Xiaoguang Zhu, Linxiao Gong, Lianlong Sun, Yang Liu, Haoyu Wang, Jing Liu,
- Abstract要約: 実世界の医療データセットは、一般的に複数のソースからの体系的なバイアスを含む。
本稿では,バイアスを特定し,対処するDual-Stream Feature Deorrelation Frameworkを提案する。
本手法では,因果関係から因果関係を解き放つために,因果関係のデコリレーション・フレームワークとデュアルストリームニューラルネットワークを用いる。
- 参考スコア(独自算出の注目度): 12.190907451083765
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Medical multimodal representation learning aims to integrate heterogeneous data into unified patient representations to support clinical outcome prediction. However, real-world medical datasets commonly contain systematic biases from multiple sources, which poses significant challenges for medical multimodal representation learning. Existing approaches typically focus on effective multimodal fusion, neglecting inherent biased features that affect the generalization ability. To address these challenges, we propose a Dual-Stream Feature Decorrelation Framework that identifies and handles the biases through structural causal analysis introduced by latent confounders. Our method employs a causal-biased decorrelation framework with dual-stream neural networks to disentangle causal features from spurious correlations, utilizing generalized cross-entropy loss and mutual information minimization for effective decorrelation. The framework is model-agnostic and can be integrated into existing medical multimodal learning methods. Comprehensive experiments on MIMIC-IV, eICU, and ADNI datasets demonstrate consistent performance improvements.
- Abstract(参考訳): 医学的マルチモーダル表現学習は、臨床結果予測を支援するために、異種データを統合された患者表現に統合することを目的としている。
しかし、現実の医療データセットには、複数の情報源からの体系的なバイアスが一般的に含まれており、医療マルチモーダル表現学習において大きな課題が生じる。
既存のアプローチは、一般的に、一般化能力に影響を与える固有のバイアスのある特徴を無視して、効果的なマルチモーダル融合に焦点を当てている。
これらの課題に対処するために、潜伏した共同設立者が導入した構造因果解析によりバイアスを特定し、対処するDual-Stream Feature Deorrelation Frameworkを提案する。
提案手法では, 因果関係から因果関係を解離させるために, 因果関係のバイアス付きデコリレーション・フレームワークを用いて, 一般化されたクロスエントロピー損失と相互情報の最小化を有効デコリレーションに活用する。
このフレームワークはモデルに依存しず、既存の医療マルチモーダル学習手法に統合することができる。
MIMIC-IV、eICU、ADNIデータセットに関する総合的な実験は、一貫したパフォーマンス改善を示している。
関連論文リスト
- Causal Debiasing Medical Multimodal Representation Learning with Missing Modalities [6.02318066285653]
現実の医療データセットは、コスト、プロトコル、患者固有の制約によって、しばしばモダリティの欠如に悩まされる。
本手法は,(1) バックドア調整に基づく因果介入を近似する欠如解離モジュール,(2) 因果関係から因果関係を明示的に解離する二重分岐ニューラルネットワークの2つの重要な構成要素から構成される。
論文 参考訳(メタデータ) (2025-09-06T06:27:10Z) - Incomplete Modality Disentangled Representation for Ophthalmic Disease Grading and Diagnosis [16.95583564875497]
本稿では,不完全なモダリティ・ディアンタングル表現(IMDR)戦略を提案する。
4つのマルチモーダルデータセットの実験により、提案したIMDRが最先端の手法を大幅に上回ることを示した。
論文 参考訳(メタデータ) (2025-02-17T12:10:35Z) - Continually Evolved Multimodal Foundation Models for Cancer Prognosis [50.43145292874533]
がん予後は、患者の予後と生存率を予測する重要なタスクである。
これまでの研究では、臨床ノート、医療画像、ゲノムデータなどの多様なデータモダリティを統合し、補完的な情報を活用している。
既存のアプローチには2つの大きな制限がある。まず、各病院の患者記録など、各種のトレーニングに新しく到着したデータを組み込むことに苦慮する。
第二に、ほとんどのマルチモーダル統合手法は単純化された結合やタスク固有のパイプラインに依存しており、モダリティ間の複雑な相互依存を捉えることができない。
論文 参考訳(メタデータ) (2025-01-30T06:49:57Z) - Online Multi-modal Root Cause Analysis [61.94987309148539]
ルート原因分析(RCA)は、マイクロサービスシステムにおける障害の根本原因の特定に不可欠である。
既存のオンラインRCAメソッドは、マルチモーダルシステムにおける複雑な相互作用を見渡す単一モーダルデータのみを処理する。
OCEANは、根本原因の局在化のための新しいオンラインマルチモーダル因果構造学習手法である。
論文 参考訳(メタデータ) (2024-10-13T21:47:36Z) - Advancing Multimodal Data Fusion in Pain Recognition: A Strategy Leveraging Statistical Correlation and Human-Centered Perspectives [0.3749861135832073]
本研究では、痛み行動認識のための新しいマルチモーダルデータ融合手法を提案する。
1)データ駆動型統計関連度重みを融合戦略に統合し,2)マルチモーダル表現学習に人間中心の運動特性を取り入れた。
本研究は,患者中心型医療介入を推進し,説明可能な臨床意思決定を支援するために重要な意味を持つ。
論文 参考訳(メタデータ) (2024-03-30T11:13:18Z) - Contrastive Learning on Multimodal Analysis of Electronic Health Records [15.392566551086782]
本稿では,新しい特徴埋め込み生成モデルを提案し,マルチモーダルEHR特徴表現を得るためのマルチモーダルコントラスト損失を設計する。
本理論は, 単モーダル学習と比較して, 多モーダル学習の有効性を実証するものである。
この接続は、マルチモーダルEHR特徴表現学習に適したプライバシー保護アルゴリズムの道を開く。
論文 参考訳(メタデータ) (2024-03-22T03:01:42Z) - Beyond DAGs: A Latent Partial Causal Model for Multimodal Learning [80.44084021062105]
本稿では,非方向エッジで連結された2つの潜在結合変数を特徴とする,多モーダルデータに対する新しい潜在部分因果モデルを提案する。
特定の統計的仮定の下では、多モーダル・コントラッシブ・ラーニングによって学習された表現が、自明な変換までの潜在結合変数に対応することを示す。
事前トレーニングされたCLIPモデルの実験は、非絡み合った表現を具現化し、数ショットの学習を可能にし、さまざまな現実世界のデータセットにわたるドメインの一般化を改善する。
論文 参考訳(メタデータ) (2024-02-09T07:18:06Z) - XAI for In-hospital Mortality Prediction via Multimodal ICU Data [57.73357047856416]
マルチモーダルICUデータを用いて病院内死亡率を予測するための,効率的で説明可能なAIソリューションを提案する。
我々は,臨床データから異種入力を受信し,意思決定を行うマルチモーダル・ラーニングを我々のフレームワークに導入する。
我々の枠組みは、医療研究において重要な要素の発見を容易にする他の臨床課題に容易に移行することができる。
論文 参考訳(メタデータ) (2023-12-29T14:28:04Z) - C^2M-DoT: Cross-modal consistent multi-view medical report generation
with domain transfer network [67.97926983664676]
ドメイン転送ネットワーク(C2M-DoT)を用いたクロスモーダルなマルチビュー医療レポート生成を提案する。
C2M-DoTは、すべてのメトリクスで最先端のベースラインを大幅に上回る。
論文 参考訳(メタデータ) (2023-10-09T02:31:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。