論文の概要: Learning Clinical Representations Under Systematic Distribution Shift
- arxiv url: http://arxiv.org/abs/2603.07348v1
- Date: Sat, 07 Mar 2026 21:28:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:14.31419
- Title: Learning Clinical Representations Under Systematic Distribution Shift
- Title(参考訳): 系統的分布シフトによる臨床表現の学習
- Authors: Yuanyun Zhang, Shi Li,
- Abstract要約: 臨床予測のための実践的不変表現学習フレームワークを提案する。
本研究は, 監督的リスク最小化と, 対人環境の正則化と, 病院全体でのリスクペナルティの不変性を組み合わせたものである。
その結果、表現学習中の系統的な分布シフトを明示的に考慮すると、より堅牢な転写可能な臨床モデルが得られることが示された。
- 参考スコア(独自算出の注目度): 1.7823291802496628
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clinical machine learning models are increasingly trained using large scale, multimodal foundation paradigms, yet deployment environments often differ systematically from the data generating settings used during training. Such shifts arise from heterogeneous measurement policies, documentation practices, and institutional workflows, leading to representation entanglement between physiologic signal and practice specific artifacts. In this work, we propose a practice invariant representation learning framework for multimodal clinical prediction. We model clinical observations as arising from latent physiologic factors and environment dependent processes, and introduce an objective that jointly optimizes predictive performance while suppressing environment predictive information in the learned embedding. Concretely, we combine supervised risk minimization with adversarial environment regularization and invariant risk penalties across hospitals. Across multiple longitudinal EHR prediction tasks and cross institution evaluations, our method improves out of distribution AUROC by up to 2 to 3 points relative to masked pretraining and standard supervised baselines, while maintaining in distribution performance and improving calibration. These results demonstrate that explicitly accounting for systematic distribution shift during representation learning yields more robust and transferable clinical models, highlighting the importance of structural invariance alongside architectural scale in healthcare AI.
- Abstract(参考訳): 臨床機械学習モデルは、大規模でマルチモーダルなファンデーションパラダイムを使って、ますます訓練されているが、デプロイメント環境は、トレーニング中に使用されるデータ生成設定と体系的に異なることが多い。
このような変化は、不均一な測定方針、文書化の実践、制度的なワークフローから生じ、生理的信号と特定の人工物の間の絡み合いを生じさせる。
本研究では,マルチモーダルな臨床予測のための実践的不変表現学習フレームワークを提案する。
本研究では, 潜伏生理要因と環境依存プロセスから生じる臨床観察をモデル化し, 学習埋め込みにおける環境予測情報を抑えながら, 共同で予測性能を最適化する手法を提案する。
具体的には, 監督的リスク最小化と, 対人環境の規則化と, 病院間のリスクペナルティの不変性を組み合わせた。
複数の縦断的EHR予測タスクとクロス機関評価により,AUROCの配電性能を最大2~3ポイント向上し,配電性能の維持と校正性の向上を図った。
これらの結果は、表現学習中の系統的な分布シフトを明示的に考慮することで、より堅牢で伝達可能な臨床モデルが得られ、医療AIにおける構造的不変性の重要性が浮き彫りになることを示している。
関連論文リスト
- A Comedy of Estimators: On KL Regularization in RL Training of LLMs [81.7906270099878]
強化学習(RL)は,大規模言語モデル(LLM)の推論性能を大幅に向上させる
LLMトレーニングのRLの目的は、トレーニングされたポリシーと参照ポリシーの間の逆のKL(Kullback-Leibler)分岐である正規化項を含む。
近年の研究では、KL正則化の実施が目的の正しい勾配を与えていないことが示されており、目的と実施の相違が生じている。
いくつかの推定器構成の勾配について検討し、設計選択が勾配バイアスをどう形成するかを明らかにする。
論文 参考訳(メタデータ) (2025-12-26T04:20:58Z) - Adaptive Test-Time Training for Predicting Need for Invasive Mechanical Ventilation in Multi-Center Cohorts [4.250825424649631]
テストタイムトレーニング(TTT)は、このようなシフトを緩和するための有望なアプローチとして登場した。
In orderive Test-Time Training (AdaTTT) は、ITU設定におけるEMHベースのMV予測に適した拡張TTフレームワークである。
論文 参考訳(メタデータ) (2025-12-07T04:27:40Z) - Deep Learning Approach for Clinical Risk Identification Using Transformer Modeling of Heterogeneous EHR Data [0.0]
本研究では,トランスフォーマーを用いた経時的モデリング手法を提案し,異種ERHデータを用いた臨床リスク分類の課題に対処する。
この方法はマルチソース医療機能を入力とし、構造化データと非構造化データの統一表現を実現するために特徴埋め込み層を用いる。
実験結果から,提案モデルは従来の機械学習モデルや時間的深層学習モデルよりも精度,リコール,精度,F1スコアで優れていた。
論文 参考訳(メタデータ) (2025-11-06T08:02:21Z) - Model Hemorrhage and the Robustness Limits of Large Language Models [119.46442117681147]
大規模言語モデル(LLM)は、自然言語処理タスク全体で強力なパフォーマンスを示すが、デプロイメント用に修正された場合、大幅なパフォーマンス低下を経験する。
この現象をモデル出血(パラメータ変更とアーキテクチャ変更によるパフォーマンス低下)と定義する。
論文 参考訳(メタデータ) (2025-03-31T10:16:03Z) - Meta-Learners for Partially-Identified Treatment Effects Across Multiple Environments [67.80453452949303]
観察データから条件平均治療効果(CATE)を推定することは、パーソナライズされた医療など多くの応用に関係している。
ここでは、観測データが複数の環境からやってくる広範囲な環境に焦点を当てる。
任意の機械学習モデルと組み合わせて使用可能な境界を推定するために、異なるモデルに依存しない学習者(いわゆるメタ学習者)を提案する。
論文 参考訳(メタデータ) (2024-06-04T16:31:43Z) - Deployment of Image Analysis Algorithms under Prevalence Shifts [6.373765910269204]
領域ギャップは、医療画像解析のための機械学習(ML)ベースのソリューションの臨床的翻訳において、最も関連する障害の一つである。
そこで本研究では,トレーニング済みの分類器を新しい環境に適応させるために,推定したデプロイメントの頻度を利用して精度の高い画像分類を行うワークフローを提案する。
論文 参考訳(メタデータ) (2023-03-22T13:16:37Z) - Adversarial Sample Enhanced Domain Adaptation: A Case Study on
Predictive Modeling with Electronic Health Records [57.75125067744978]
ドメイン適応を容易にするデータ拡張手法を提案する。
逆生成したサンプルはドメイン適応時に使用される。
その結果,本手法の有効性とタスクの一般性が確認された。
論文 参考訳(メタデータ) (2021-01-13T03:20:20Z) - Learning Diverse Representations for Fast Adaptation to Distribution
Shift [78.83747601814669]
本稿では,複数のモデルを学習する手法を提案する。
分散シフトへの迅速な適応を促進するフレームワークの能力を実証する。
論文 参考訳(メタデータ) (2020-06-12T12:23:50Z) - Variational Learning of Individual Survival Distributions [21.40142425105635]
本稿では,分散学習技術とディープニューラルネットワークの最近の進歩を基盤として,変分生存推定(VSI)と呼ばれる変動時間対イベント予測モデルを提案する。
提案手法の有効性を検証するため, 合成および実世界の両方のデータセットに対する広範な実験を行い, 競合するソリューションと比較して性能が向上したことを示す。
論文 参考訳(メタデータ) (2020-03-09T22:09:51Z) - Estimating the Effects of Continuous-valued Interventions using
Generative Adversarial Networks [103.14809802212535]
我々は,連続的評価介入の効果を推定する問題に対処するため,GAN(Generative Adversarial Network)フレームワークを構築した。
我々のモデルであるSCIGANは柔軟であり、いくつかの異なる継続的な介入に対する対実的な結果の同時推定が可能である。
継続的な介入に移行することによって生じる課題に対処するために、差別者のための新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-02-27T18:46:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。