論文の概要: Clin-JEPA: A Multi-Phase Co-Training Framework for Joint-Embedding Predictive Pretraining on EHR Patient Trajectories
- arxiv url: http://arxiv.org/abs/2605.10840v2
- Date: Tue, 12 May 2026 07:38:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 18:21:07.141789
- Title: Clin-JEPA: A Multi-Phase Co-Training Framework for Joint-Embedding Predictive Pretraining on EHR Patient Trajectories
- Title(参考訳): Clin-JEPA: EHR患者軌道上での複合組込み予測予測のための多相協調学習フレームワーク
- Authors: Yixuan Yang, Mehak Arora, Ryan Zhang, Baraa Abed, Junseob Kim, Tilendra Choudhary, Md Hassanuzzaman, Kevin Zhu, Ayman Ali, Chengkun Yang, Alasdair Edward Gent, Victor Moas, Rishikesan Kamaleswaran,
- Abstract要約: Clin-JEPAは、HR患者軌道上での予測(JEPA)事前トレーニングのための多相コトレーニングフレームワークである。
MIMIC-IV ICUデータでは、3つの独立した評価がフレームワークをサポートしている。
- 参考スコア(独自算出の注目度): 7.992399976910451
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present Clin-JEPA, a multi-phase co-training framework for joint-embedding predictive (JEPA) pretraining on EHR patient trajectories. JEPA architectures have enabled latent-space planning in robotics and high-quality representation learning in vision, but extending the paradigm to EHR data -- to obtain a single backbone that simultaneously forecasts patient trajectories and serves diverse downstream risk-prediction tasks without per-task fine-tuning -- remains an open challenge. Existing JEPA frameworks either discard the predictor after pretraining (I-JEPA, V-JEPA) or train it on a frozen pretrained encoder (V-JEPA 2-AC), leaving the encoder unaware of the rollout signal that the retained predictor must use at inference; co-training the encoder and predictor under a shared JEPA prediction objective would supply this grounding, but naïve co-training is unstable, with representation collapse and online/target drift causing autoregressive rollout to diverge. Clin-JEPA's five-phase pretraining curriculum -- predictor warmup, joint refinement, EMA target alignment, hard sync, and predictor finalization -- addresses each failure mode by phase, stably co-training a Qwen3-8B-based encoder and a 92M-parameter latent trajectory predictor. On MIMIC-IV ICU data, three independent evaluations support the framework: (1) latent $\ell_1$ rollout drift uniquely converges ($-$15.7%) over 48-hour horizons while baselines and ablations diverge (+3% to +4951%); (2) the encoder learns a clinically discriminative latent geometry (deteriorating-patient cohorts displace 4.83$\times$ further than stable patients in latent space, vs $\leq$2.62$\times$ for baseline encoders); (3) a single backbone outperforms strong tabular and sequence baselines on multi-task downstream evaluation. Clin-JEPA achieves mean AUROC 0.851 on ICareFM EEP and 0.883 on 8 binary risk tasks (+0.038 and +0.041 vs baseline average).
- Abstract(参考訳): Clin-JEPAは関節内包予測(JEPA)のための多相協調訓練フレームワークである。
JEPAアーキテクチャは、ロボット工学における潜時空間計画と視覚における高品質な表現学習を可能にしたが、パラダイムをEHRデータに拡張することで、患者の軌道を同時に予測し、タスク毎の微調整なしでさまざまな下流リスク予測タスクを提供する単一のバックボーンを取得することは、依然としてオープンな課題である。
既存のJEPAフレームワークは、事前トレーニング後の予測器(I-JEPA、V-JEPA)を捨てるか、あるいは凍結した事前訓練されたエンコーダ(V-JEPA 2-AC)でトレーニングし、保持された予測器が推論時に使用しなければならないロールアウト信号に気づかないままにしておく。
Clin-JEPAの5段階事前訓練カリキュラム -- 予測器のウォームアップ、共同改良、EMAターゲットアライメント、ハードシンク、予測器ファイナライゼーション -- は、Qwen3-8Bベースのエンコーダと92Mの潜航軌道予測器を安定的に併用して、各障害モードにフェーズ毎に対処する。
MIMIC-IV ICUデータでは、3つの独立した評価がフレームワークをサポートしている: (1) latent $\ell_1$ rollout driftは48時間水平線上に一意に収束するが、ベースラインとアブレーションは分岐し(+3%から+4951%)、 (2) encoderは臨床的に識別可能な潜伏幾何学を学習する(deteriorating-patient cohorts displace 4.83$\times$は潜伏空間の安定な患者より多く、対して$\leq$2.62$\times$はベースラインエンコーダに対して)。
Clin-JEPAは、ICareFM EEP上の平均AUROC 0.851と、8つのバイナリリスクタスク(ベースライン平均に対する+0.038と+0.041)における0.883を達成する。
関連論文リスト
- A Cross-Layered Multi-Drone Coordination for Medical Supply Delivery during Disaster Response Management [0.45671221781968324]
我々は,協調型マルチドローン医療配信のための新しいCTDE Deep Q-NetworkアルゴリズムであるCEDAを提案する。
CEDAは、動的不確実性の下で、トリアージプライオリティ対応ルーティング、マルチエージェント調整、エネルギー効率の高いナビゲーションを共同で最適化する。
CEDAは85%以上のデリバリ完了率を達成し、トレーニング中の障害物衝突を90%以上削減し、平均6人の患者に平均0.82のトリアージ効率を提供する。
論文 参考訳(メタデータ) (2026-05-10T05:43:51Z) - SPLICE: Latent Diffusion over JEPA Embeddings for Conformal Time-Series Inpainting [0.5076419064097734]
時系列計算のための生成モデルは、強い復元精度を実現するが、有限サンプル信頼性保証は提供しない。
SPLICEは分散のないオンライン適応予測区間と遅延生成計算を結合したモジュラーフレームワークである。
プールされたJEPAエンコーダは、9つのフィードでトレーニングされ、4つの見えないドメインに転送される。
論文 参考訳(メタデータ) (2026-04-30T18:27:08Z) - PRIME: Prototype-Driven Multimodal Pretraining for Cancer Prognosis with Missing Modalities [86.63247982275396]
PRIMEは、欠落を認識したマルチモーダルな自己教師型事前トレーニングフレームワークである。
部分的に観察されたコホートから頑健で伝達可能な表現を学ぶ。
The Cancer Genome AtlasのPRIMEを32種類の癌に対してラベルフリープレトレーニングで評価した。
論文 参考訳(メタデータ) (2026-04-05T21:14:27Z) - Unifying Group-Relative and Self-Distillation Policy Optimization via Sample Routing [79.88256756334327]
自己蒸留政策最適化(SDPO)は、より密集したロジットレベルの監視を提供することによってこの問題に対処する。
サンプル制御ポリシー最適化(SRPO)を提案する。
SRPOは、試料をGRPOの報酬整合強化に向け、サンプルをSDPOの目標ロジットレベルの補正に向ける。
論文 参考訳(メタデータ) (2026-04-02T17:29:18Z) - LeJEPA: Provable and Scalable Self-Supervised Learning Without the Heuristics [53.247652209132376]
JEPA(Joint-Embedding Predictive Architectures)は、有望な青写真を提供するが、実践的なガイダンスや理論の欠如がアドホックな研究開発につながっている。
我々はJEPAの包括的な理論を示し、それをbf LeJEPAでインスタンス化する。
論文 参考訳(メタデータ) (2025-11-11T18:21:55Z) - Agentic World Modeling for 6G: Near-Real-Time Generative State-Space Reasoning [70.56067503630486]
第6世代(6G)インテリジェンスは、流動的なトークン予測ではなく、想像と選択の能力を校正している、と我々は主張する。
We showed that WM-MS3M cuts mean absolute error (MAE) by 1.69% vs MS3M with 32% less parameters and similar latency, and achieve a 35-80% lower root mean squared error (RMSE) than attention/hybrid baselines with 2.3-4.1x faster inference。
論文 参考訳(メタデータ) (2025-11-04T17:22:22Z) - Label-Efficient Grasp Joint Prediction with Point-JEPA [0.0]
Point-JEPAによる3次元自己教師付き事前トレーニングにより,ラベル効率のよいグリップ・アングル予測が可能となる。
JEPAスタイルの事前学習は、データ効率のよい学習のための実践的なレバーである。
論文 参考訳(メタデータ) (2025-09-13T21:00:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。