論文の概要: RELEAP: Reinforcement-Enhanced Label-Efficient Active Phenotyping for Electronic Health Records
- arxiv url: http://arxiv.org/abs/2511.07473v1
- Date: Wed, 12 Nov 2025 01:01:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-12 20:17:03.347715
- Title: RELEAP: Reinforcement-Enhanced Label-Efficient Active Phenotyping for Electronic Health Records
- Title(参考訳): RELEAP: 電子カルテ用強化ラベル有効能動フェノタイピング
- Authors: Yang Yang, Kathryn Pollak, Bibhas Chakraborty, Molei Liu, Doudou Zhou, Chuan Hong,
- Abstract要約: 本稿では,強化学習に基づく能動学習フレームワークであるReinforcement-Enhanced Label-Efficient Active Phenotyping (RELEAP)を提案する。
肺がん発生リスク予測のためのDuke University Health System(DUHS)コホートを用いたRELEAPの評価を行った。
下流のパフォーマンスをフィードバックとして使用することで、RELEAPは同じラベル付け予算の下でメソッドよりもスムーズで安定したゲインを実現した。
- 参考スコア(独自算出の注目度): 8.26075406169186
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Objective: Electronic health record (EHR) phenotyping often relies on noisy proxy labels, which undermine the reliability of downstream risk prediction. Active learning can reduce annotation costs, but most rely on fixed heuristics and do not ensure that phenotype refinement improves prediction performance. Our goal was to develop a framework that directly uses downstream prediction performance as feedback to guide phenotype correction and sample selection under constrained labeling budgets. Materials and Methods: We propose Reinforcement-Enhanced Label-Efficient Active Phenotyping (RELEAP), a reinforcement learning-based active learning framework. RELEAP adaptively integrates multiple querying strategies and, unlike prior methods, updates its policy based on feedback from downstream models. We evaluated RELEAP on a de-identified Duke University Health System (DUHS) cohort (2014-2024) for incident lung cancer risk prediction, using logistic regression and penalized Cox survival models. Performance was benchmarked against noisy-label baselines and single-strategy active learning. Results: RELEAP consistently outperformed all baselines. Logistic AUC increased from 0.774 to 0.805 and survival C-index from 0.718 to 0.752. Using downstream performance as feedback, RELEAP produced smoother and more stable gains than heuristic methods under the same labeling budget. Discussion: By linking phenotype refinement to prediction outcomes, RELEAP learns which samples most improve downstream discrimination and calibration, offering a more principled alternative to fixed active learning rules. Conclusion: RELEAP optimizes phenotype correction through downstream feedback, offering a scalable, label-efficient paradigm that reduces manual chart review and enhances the reliability of EHR-based risk prediction.
- Abstract(参考訳): 目的:電子健康記録(EHR)表現型付けは、しばしばノイズの多いプロキシラベルに依存し、下流のリスク予測の信頼性を損なう。
アクティブラーニングはアノテーションのコストを削減できるが、ほとんどの場合固定ヒューリスティックスに依存しており、表現型の改良が予測性能を向上させることを保証しない。
我々のゴールは、制約付きラベル付け予算の下で表現型補正とサンプル選択を誘導するためのフィードバックとして、下流予測性能を直接利用するフレームワークを開発することであった。
材料と方法: 強化学習に基づく能動学習フレームワークRELEAP(Reinforcement-Enhanced Label-Efficient Active Phenotyping)を提案する。
RELEAPは複数のクエリ戦略を適応的に統合し、以前の方法とは異なり、下流モデルからのフィードバックに基づいてポリシーを更新する。
肺がん発生リスク予測のためのDuke University Health System(DUHS)コホート(2014-2024)を用いて,ロジスティック回帰とCox生存モデルを用いてRELEAPを評価した。
ノイズの多いラベルベースラインとシングルストラテジーなアクティブラーニングに対して、パフォーマンスをベンチマークした。
結果: RELEAPはすべてのベースラインを一貫して上回りました。
ロジスティックAUCは0.774から0.805に増加し、生存率は0.718から0.752に増加した。
下流のパフォーマンスをフィードバックとして使用することで、RELEAPは同じラベル付け予算の下でヒューリスティックな手法よりもスムーズで安定したゲインを実現した。
議論:表現型洗練と予測結果のリンクにより、RELEAPは、下流の識別と校正を最も改善したサンプルを学習し、固定されたアクティブな学習規則に代わるより原則化された代替手段を提供する。
結論:RELEAPは、下流からのフィードバックを通じて表現型補正を最適化し、手動チャートのレビューを減らし、EHRベースのリスク予測の信頼性を高める、スケーラブルでラベル効率のよいパラダイムを提供する。
関連論文リスト
- Uncertainty-Guided Model Selection for Tabular Foundation Models in Biomolecule Efficacy Prediction [3.108481950101193]
本研究では,モデル選択のための不確実性誘導戦略について検討する。
本研究では,直列型特徴量を用いたTabPFNモデルが,最先端の予測器を上回りうることを示す。
論文 参考訳(メタデータ) (2025-10-02T18:33:19Z) - NAIPv2: Debiased Pairwise Learning for Efficient Paper Quality Estimation [58.30936615525824]
本稿では,紙の品質評価のための非バイアスで効率的なフレームワークであるNAIPv2を提案する。
NAIPv2は、レビューアレーティングの不整合を低減するために、ドメイン年グループ内でペアワイズ学習を採用している。
これはペアワイズ比較に基づいてトレーニングされるが、デプロイ時に効率的なポイントワイズ予測を可能にする。
論文 参考訳(メタデータ) (2025-09-29T17:59:23Z) - Electroencephalogram Emotion Recognition via AUC Maximization [0.0]
不均衡データセットは神経科学、認知科学、医学診断などの分野で大きな課題を提起する。
本研究は,DEAPデータセットにおけるライキングラベルを例として,イシュークラスの不均衡に対処する。
論文 参考訳(メタデータ) (2024-08-16T19:08:27Z) - Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。
iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-10T19:17:23Z) - Regressor-free Molecule Generation to Support Drug Response Prediction [83.25894107956735]
目標IC50スコアに基づく条件生成により、より効率的なサンプリングスペースを得ることができる。
回帰自由誘導は、拡散モデルのスコア推定と、数値ラベルに基づく回帰制御モデルの勾配を結合する。
論文 参考訳(メタデータ) (2024-05-23T13:22:17Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。
本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T14:49:59Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。