論文の概要: Handling and Interpreting Missing Modalities in Patient Clinical Trajectories via Autoregressive Sequence Modeling
- arxiv url: http://arxiv.org/abs/2604.18753v1
- Date: Mon, 20 Apr 2026 18:55:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.438771
- Title: Handling and Interpreting Missing Modalities in Patient Clinical Trajectories via Autoregressive Sequence Modeling
- Title(参考訳): 自己回帰的シーケンスモデリングによる臨床検体における欠失の対応と解釈
- Authors: Andrew Wang, Ellie Pavlick, Ritambhara Singh,
- Abstract要約: 我々は、安全で透明な臨床AIの標準的デシプラタムに対処しながら、欠落したモダリティをプロファイルし、対処するためのフレームワークを開発する。
変換器ベースアーキテクチャを用いた自己回帰シーケンスモデリングはMIMIC-IVおよびeICUファインチューニングベンチマークのベースラインよりも優れていることを示す。
- 参考スコア(独自算出の注目度): 24.896312231457653
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: An active challenge in developing multimodal machine learning (ML) models for healthcare is handling missing modalities during training and deployment. As clinical datasets are inherently temporal and sparse in terms of modality presence, capturing the underlying predictive signal via diagnostic multimodal ML models while retaining model explainability remains an ongoing challenge. In this work, we address this by re-framing clinical diagnosis as an autoregressive sequence modeling task, utilizing causal decoders from large language models (LLMs) to model a patient's multimodal trajectory. We first introduce a missingness-aware contrastive pre-training objective that integrates multiple modalities in datasets with missingness in a shared latent space. We then show that autoregressive sequence modeling with transformer-based architectures outperforms baselines on the MIMIC-IV and eICU fine-tuning benchmarks. Finally, we use interpretability techniques to move beyond performance boosts and find that across various patient stays, removing modalities leads to divergent behavior that our contrastive pre-training mitigates. By abstracting clinical diagnosis as sequence modeling and interpreting patient stay trajectories, we develop a framework to profile and handle missing modalities while addressing the canonical desideratum of safe, transparent clinical AI.
- Abstract(参考訳): 医療用マルチモーダル機械学習(ML)モデルを開発する上での積極的な課題は、トレーニングとデプロイメント中に欠落したモダリティを扱うことだ。
臨床データセットは本質的に時間的かつ疎外であるため、診断的マルチモーダルMLモデルを通じて基礎となる予測信号を捉えながら、モデル説明可能性を維持することは、現在進行中の課題である。
本研究では,大言語モデル(LLM)の因果デコーダを用いて患者のマルチモーダル軌跡をモデル化し,自己回帰的シーケンスモデリングタスクとして臨床診断を再定義することにより,この問題に対処する。
まず、複数のモーダルをデータセットに統合し、共有潜在空間における欠落を解消する、欠落を意識したコントラスト付き事前学習目標を提案する。
次に,変換器ベースアーキテクチャを用いた自己回帰シーケンスモデリングがMIMIC-IVおよびeICU微細チューニングベンチマークのベースラインより優れていることを示す。
最後に、私たちは解釈可能性技術を用いて、パフォーマンスの向上を超えて、さまざまな患者が滞在する中で、モダリティの除去は、我々の対照的な事前学習が緩和する散発的な行動につながることを発見します。
臨床診断をシークエンス・モデリングとして抽象化し,患者の滞在軌跡を解釈することにより,安全な透明な臨床AIの標準デシプラタムに対処しながら,欠落したモダリティをプロファイル化し,対処する枠組みを開発する。
関連論文リスト
- Delving Aleatoric Uncertainty in Medical Image Segmentation via Vision Foundation Models [56.29123284262618]
本研究は,視覚基盤モデルの普遍的表現能力を生かして固有データ不確実性を推定することを提案する。
モデルのデコード表現の特徴の多様性を分析し,その特異値エネルギーを定量化し,各クラスに対する意味知覚尺度を定義する。
この基礎に基づいて,本研究は,(1)潜在的にノイズの多いサンプルを排除し,モデル学習品質を向上させるためのアレータリック不確実性認識データフィルタリング機構,(2)意味認識尺度に基づくトレーニング中にクラス固有の損失重みを適応的に調整する動的不確実性認識最適化戦略,およびトレーニング安定性を向上させるラベル認知機構の2つの不確実性駆動型アプリケーション戦略を設計する。
論文 参考訳(メタデータ) (2026-04-13T03:59:54Z) - impuTMAE: Multi-modal Transformer with Masked Pre-training for Missing Modalities Imputation in Cancer Survival Prediction [75.43342771863837]
我々は,効率的なマルチモーダル事前学習戦略を備えた新しいトランスフォーマーに基づくエンドツーエンドアプローチである impuTMAE を紹介する。
マスクされたパッチを再構築することで、モダリティの欠如を同時に示唆しながら、モダリティ間の相互作用とモダリティ内相互作用を学習する。
本モデルは,TGA-GBM/LGGとBraTSデータセットを用いたグリオーマ生存予測のために,異種不完全データに基づいて事前訓練を行った。
論文 参考訳(メタデータ) (2025-08-08T10:01:16Z) - Continually Evolved Multimodal Foundation Models for Cancer Prognosis [50.43145292874533]
がん予後は、患者の予後と生存率を予測する重要なタスクである。
これまでの研究では、臨床ノート、医療画像、ゲノムデータなどの多様なデータモダリティを統合し、補完的な情報を活用している。
既存のアプローチには2つの大きな制限がある。まず、各病院の患者記録など、各種のトレーニングに新しく到着したデータを組み込むことに苦慮する。
第二に、ほとんどのマルチモーダル統合手法は単純化された結合やタスク固有のパイプラインに依存しており、モダリティ間の複雑な相互依存を捉えることができない。
論文 参考訳(メタデータ) (2025-01-30T06:49:57Z) - UNICORN: A Deep Learning Model for Integrating Multi-Stain Data in Histopathology [2.9389205138207277]
UNICORNは動脈硬化の重症度予測のための多段階組織学を処理できるマルチモーダルトランスフォーマーである。
このアーキテクチャは、2段階のエンドツーエンドのトレーニング可能なモデルと、トランスフォーマーの自己保持ブロックを利用する特殊なモジュールから構成される。
UNICORNは0.67の分類精度を達成し、他の最先端モデルを上回った。
論文 参考訳(メタデータ) (2024-09-26T12:13:52Z) - PMT: Progressive Mean Teacher via Exploring Temporal Consistency for Semi-Supervised Medical Image Segmentation [51.509573838103854]
医用画像セグメンテーションのための半教師付き学習フレームワークであるプログレッシブ平均教師(PMT)を提案する。
我々のPMTは、トレーニングプロセスにおいて、堅牢で多様な特徴を学習することで、高忠実な擬似ラベルを生成する。
CT と MRI の異なる2つのデータセットに対する実験結果から,本手法が最先端の医用画像分割法より優れていることが示された。
論文 参考訳(メタデータ) (2024-09-08T15:02:25Z) - MMA-DFER: MultiModal Adaptation of unimodal models for Dynamic Facial Expression Recognition in-the-wild [81.32127423981426]
実世界のアプリケーションでは,音声およびビデオデータに基づくマルチモーダル感情認識が重要である。
近年の手法は、強力なマルチモーダルエンコーダの事前学習に自己教師付き学習(SSL)の進歩を活用することに重点を置いている。
SSL-pre-trained disimodal encoders を用いて,この問題に対する異なる視点とマルチモーダル DFER の性能向上について検討する。
論文 参考訳(メタデータ) (2024-04-13T13:39:26Z) - Intensive Care as One Big Sequence Modeling Problem [1.6114012813668932]
本稿では、患者と医療提供者とのインタラクションをイベントストリームとして表現する、シーケンスモデリングとしてのヘルスケアのパラダイムを提案する。
我々はMIMIC-IVデータセットから一様イベントストリームフォーマットに異種臨床記録を変換したシーケンスモデリングベンチマークMIMIC-SEQを開発した。
論文 参考訳(メタデータ) (2024-02-27T13:36:55Z) - A Deep-Generative Hybrid Model to Integrate Multimodal and Dynamic Connectivity for Predicting Spectrum-Level Deficits in Autism [5.200461964737113]
我々のフレームワークの生成部分は、構造的に規則化された動的辞書学習(sr-DDL)モデルである。
本フレームワークの深部はLSTM-ANNブロックであり,Sr-DDL負荷の経時的変化をモデル化し,多次元的臨床的重症度を予測する。
自閉症スペクトラム障害(ASD)と診断された57例のマルチスコア予測課題における枠組みの検証を行った。
論文 参考訳(メタデータ) (2020-07-03T20:18:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。