論文の概要: Improving Pediatric Emergency Department Triage with Modality Dropout in Late Fusion Multimodal EHR Models
- arxiv url: http://arxiv.org/abs/2604.09905v1
- Date: Fri, 10 Apr 2026 21:01:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:15.739502
- Title: Improving Pediatric Emergency Department Triage with Modality Dropout in Late Fusion Multimodal EHR Models
- Title(参考訳): 後期核融合型マルチモーダルEHRモデルにおけるモダリティ低下を伴う小児救急部門トリアージの改善
- Authors: Tyler Yang, Romal Mitr,
- Abstract要約: 我々はXGBoostとBio_ClinicalBERTによる非構造化臨床テキストを介してバイタルを処理するマルチモーダルアーキテクチャを提案する。
我々はMIMIC-IVとNHAMCSのデータセットから成人の出会いを学習する。
30-40%の対称モダリティ低下率を適用したことにより、見えない小児コホートの性能が急上昇した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Emergency department triage relies heavily on both quantitative vital signs and qualitative clinical notes, yet multimodal machine learning models predicting triage acuity often suffer from modality collapse by over-relying on structured tabular data. This limitation severely hinders demographic generalizability, particularly for pediatric patients where developmental variations in vital signs make unstructured clinical narratives uniquely crucial. To address this gap, we propose a late-fusion multimodal architecture that processes tabular vitals via XGBoost and unstructured clinical text via Bio_ClinicalBERT, combined through a Logistic Regression meta-classifier to predict the 5-level Emergency Severity Index. To explicitly target the external validity problem, we train our model exclusively on adult encounters from the MIMIC-IV and NHAMCS datasets and evaluate its zero-shot generalization on a traditionally overlooked pediatric cohort. Furthermore, we employ symmetric modality dropout during training to prevent the ensemble from overfitting to adult-specific clinical correlations. Our results demonstrate that the multimodal framework significantly outperforms single-modality baselines. Most notably, applying a 30-40% symmetric modality dropout rate yielded steep performance improvements in the unseen pediatric cohort, elevating the Quadratic Weighted Kappa to 0.351. These findings highlight modality dropout as a critical regularization technique for mitigating modality collapse and enhancing cross-demographic generalization in clinical AI.
- Abstract(参考訳): 救急部門トリアージは定量的なバイタルサインと定性的臨床ノートの両方に大きく依存するが、トリアージの明度を予測するマルチモーダル機械学習モデルは、構造化された表データの過度な参照によって、しばしばモダリティの崩壊に悩まされる。
この制限は人口統計学の一般化を著しく阻害するものであり、特に小児の発達的変化が、非構造的な臨床物語を独特に重要なものにしている。
このギャップに対処するため、我々は、XGBoostおよびBio_ClinicalBERTを介して表状バイタルと非構造化臨床テキストを処理し、ロジスティック回帰メタ分類器で結合して5レベルの緊急度指数を予測する、遅延融合型マルチモーダルアーキテクチャを提案する。
そこで我々は,MIMIC-IV と NHAMCS のデータセットから成人の遭遇を対象とし,従来見過ごされた小児コホート上でのゼロショットの一般化を評価する。
さらに,訓練中に左右対称なモダリティ・ドロップアウトを用いて,アンサンブルが大人特有の臨床相関に過度に収まらないようにした。
以上の結果から,マルチモーダル・フレームワークは単一モダリティ・ベースラインを著しく上回ることがわかった。
特に、30-40%の対称性のモダリティ降下率を適用すると、見えない小児コホートの性能が急上昇し、四重重みカッパは0.351に上昇した。
これらの知見は、モダリティ崩壊を緩和し、臨床AIにおけるクロスデデミノグラフィーの一般化を促進するための重要な正則化手法として、モダリティ・ドロップアウトを強調した。
関連論文リスト
- PRIME: Prototype-Driven Multimodal Pretraining for Cancer Prognosis with Missing Modalities [86.63247982275396]
PRIMEは、欠落を認識したマルチモーダルな自己教師型事前トレーニングフレームワークである。
部分的に観察されたコホートから頑健で伝達可能な表現を学ぶ。
The Cancer Genome AtlasのPRIMEを32種類の癌に対してラベルフリープレトレーニングで評価した。
論文 参考訳(メタデータ) (2026-04-05T21:14:27Z) - Clinical Cognition Alignment for Gastrointestinal Diagnosis with Multimodal LLMs [63.535652574541764]
MLLM(Multimodal Large Language Models)は医用画像解析において顕著な可能性を示した。
消化器内視鏡におけるそれらの応用は、現在、2つの重要な限界によって妨げられている。
本稿では,これらの課題に対処する新しい臨床認知アライメント(CogAlign)フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-21T07:47:37Z) - Suppressing Prior-Comparison Hallucinations in Radiology Report Generation via Semantically Decoupled Latent Steering [94.37535002230504]
本研究では,Semantically Decoupled Latent Steeringと呼ばれる学習自由な推論時間制御フレームワークを開発した。
提案手法は,大言語モデル (LLM) による意味分解による意味のない介入ベクトルを構築する。
本手法は歴史的幻覚の可能性を著しく低下させることを示す。
論文 参考訳(メタデータ) (2026-02-27T04:49:01Z) - Cross-Linguistic Persona-Driven Data Synthesis for Robust Multimodal Cognitive Decline Detection [20.599682298329213]
我々は、制御可能なゼロショットマルチモーダルデータ合成とChain-of-Thought deductionファインチューニングを統合する新しいフレームワークであるSynCogを紹介する。
この生成パラダイムは、様々な言語にまたがる臨床コーパスの迅速でゼロショット展開を可能にする。
ADReSSとADReSSoベンチマークの実験は、限られた臨床データを合成表現型で増強することで、競争力のある診断性能が得られることを示した。
論文 参考訳(メタデータ) (2026-02-08T14:10:05Z) - PiCME: Pipeline for Contrastive Modality Evaluation and Encoding in the MIMIC Dataset [16.263862005367667]
マルチモーダル深層学習は、多様な患者データを統合することで臨床予測を改善することを約束する。
対照的な学習は、タスク間で再利用可能な統一表現を生成することによって、この統合を促進する。
PiCMEはMIMICのすべてのモダリティの組み合わせでコントラスト学習をスケールした最初の企業である。
論文 参考訳(メタデータ) (2025-07-03T20:45:37Z) - Adaptable Cardiovascular Disease Risk Prediction from Heterogeneous Data using Large Language Models [70.64969663547703]
AdaCVDは、英国バイオバンクから50万人以上の参加者を対象に、大規模な言語モデルに基づいて構築された適応可能なCVDリスク予測フレームワークである。
包括的かつ可変的な患者情報を柔軟に取り込み、構造化データと非構造化テキストの両方をシームレスに統合し、最小限の追加データを使用して新規患者の集団に迅速に適応する。
論文 参考訳(メタデータ) (2025-05-30T14:42:02Z) - CTPD: Cross-Modal Temporal Pattern Discovery for Enhanced Multimodal Electronic Health Records Analysis [50.56875995511431]
マルチモーダルEHRデータから有意な時間的パターンを効率的に抽出するために,CTPD(Cross-Modal Temporal Pattern Discovery)フレームワークを導入する。
提案手法では,時間的セマンティックな埋め込みを生成するためにスロットアテンションを用いて改良された時間的パターン表現を提案する。
論文 参考訳(メタデータ) (2024-11-01T15:54:07Z) - EMERGE: Enhancing Multimodal Electronic Health Records Predictive Modeling with Retrieval-Augmented Generation [22.94521527609479]
EMERGEはRetrieval-Augmented Generation(RAG)駆動のフレームワークであり、マルチモーダルEHR予測モデリングを強化する。
時系列データと臨床ノートからエンティティを抽出し,LLM(Large Language Models)を誘導し,プロのPrimeKGと整合させる。
抽出した知識は、患者の健康状態のタスク関連サマリーを生成するために使用される。
論文 参考訳(メタデータ) (2024-05-27T10:53:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。