論文の概要: CURA: Clinical Uncertainty Risk Alignment for Language Model-Based Risk Prediction
- arxiv url: http://arxiv.org/abs/2604.14651v1
- Date: Thu, 16 Apr 2026 05:58:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 21:29:31.748335
- Title: CURA: Clinical Uncertainty Risk Alignment for Language Model-Based Risk Prediction
- Title(参考訳): CURA:言語モデルに基づくリスク予測のための臨床不確実性リスクアライメント
- Authors: Sizhe Wang, Ziqi Xu, Claire Najjuuko, Charles Alba, Chenyang Lu,
- Abstract要約: 本稿では,臨床用LMに基づくリスク推定と,個々のエラー確率とコホートレベルのあいまいさを一致させる枠組みを提案する。
MIMIC-IV 臨床リスク予測タスクの実験では、CURA は差別を実質的に損なうことなくキャリブレーションの指標を一貫して改善している。
- 参考スコア(独自算出の注目度): 10.129412789850239
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Clinical language models (LMs) are increasingly applied to support clinical risk prediction from free-text notes, yet their uncertainty estimates often remain poorly calibrated and clinically unreliable. In this work, we propose Clinical Uncertainty Risk Alignment (CURA), a framework that aligns clinical LM-based risk estimates and uncertainty with both individual error likelihoods and cohort-level ambiguities. CURA first fine-tunes domain-specific clinical LMs to obtain task-adapted patient embeddings, and then performs uncertainty fine-tuning of a multi-head classifier using a bi-level uncertainty objective. Specifically, an individual-level calibration term aligns predictive uncertainty with each patient's likelihood of error, while a cohort-aware regularizer pulls risk estimates toward event rates in their local neighborhoods in the embedding space and places extra weight on ambiguous cohorts near the decision boundary. We further show that this cohort-aware term can be interpreted as a cross-entropy loss with neighborhood-informed soft labels, providing a label-smoothing view of our method. Extensive experiments on MIMIC-IV clinical risk prediction tasks across various clinical LMs show that CURA consistently improves calibration metrics without substantially compromising discrimination. Further analysis illustrates that CURA reduces overconfident false reassurance and yields more trustworthy uncertainty estimates for downstream clinical decision support.
- Abstract(参考訳): 臨床言語モデル(LM)は、フリーテキストノートから臨床リスク予測を支援するためにますます応用されているが、その不確実性評価は、校正が不十分で臨床的に信頼性が低いままであることが多い。
本研究は,臨床的不確実性リスクアライメント(CURA, Clinical Uncertainity Risk Alignment)を提案する。
CURAは、まず、タスク適応型患者埋め込みを得るために、ファインチューンドメイン特異的臨床用LMを初めて取得し、次いで、双方向の不確実性目的を用いて、マルチヘッド分類器の不確実性微調整を行う。
特に、個々のレベルのキャリブレーション項は、各患者のエラーの確率と予測の不確かさを一致させ、コホート認識正規化器は、埋め込み空間内の各地域の事象率に対してリスク推定を引き出し、決定境界付近の曖昧なコホートに余分な重みを置く。
さらに, このコホート認識項は, 周辺情報を用いたソフトラベルとの相互エントロピー損失と解釈できることを示す。
MIMIC-IV 臨床リスク予測タスクの多岐にわたる実験により,CURA は差別を著しく損なうことなくキャリブレーションの指標を一貫して改善することが示された。
さらに分析したところ、CURAは自信過剰な偽の安全性を減らし、下流の臨床的決定支援のための信頼性の高い不確実性評価をもたらすことが示されている。
関連論文リスト
- Guideline-Grounded Evidence Accumulation for High-Stakes Agent Verification [60.18369393468405]
既存の検証器は通常、ドメイン知識の欠如と限られた校正のために性能が劣る。
GLEANは専門家によって計算されたプロトコルをトラジェクトリインフォームされ、よく校正された正当性信号にコンパイルする。
我々は,MIMIC-IVデータセットから得られた3つの疾患の薬物的臨床診断でGLEANを実証的に検証した。
論文 参考訳(メタデータ) (2026-03-03T09:36:43Z) - Uncertainty-Calibrated Prediction of Randomly-Timed Biomarker Trajectories with Conformal Bands [24.335811693519165]
臨床データからバイオマーカー軌跡の不確実性判定のためのコンフォメーション手法を提案する。
提案手法は,非整合性スコアを用いたランダム時間軌道の設定に共形予測を拡張した。
アルツハイマー病の進行リスクの高い被験者を同定する上で, コンフォメーションバンドの臨床的有用性を示す。
論文 参考訳(メタデータ) (2025-11-17T21:04:14Z) - Conformal Lesion Segmentation for 3D Medical Images [82.92159832699583]
本稿では,データ駆動しきい値の校正をコンフォーマル化することで,テスト時間FNRが目標許容値以下であることを保証する,リスク制約付きフレームワークを提案する。
5つのバックボーンモデルにまたがる6つの3D-LSデータセット上でのCLSの統計的健全性と予測性能を検証し,臨床実践におけるリスク認識セグメンテーションの展開に関する実用的な知見を得た。
論文 参考訳(メタデータ) (2025-10-19T08:21:00Z) - Towards Reliable LLM-based Robot Planning via Combined Uncertainty Estimation [68.106428321492]
大規模言語モデル (LLM) は高度な推論能力を示し、ロボットが自然言語の命令を理解し、適切な接地で高レベルな計画を生成することができる。
LLMの幻覚は重大な課題であり、しばしば過度に信頼され、不一致または安全でない計画に繋がる。
本研究は, 信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性評価を別々に評価するものである。
論文 参考訳(メタデータ) (2025-10-09T10:26:58Z) - Mind the Gap: Benchmarking LLM Uncertainty, Discrimination, and Calibration in Specialty-Aware Clinical QA [4.501692468580528]
臨床質問応答(QA)に焦点を当てた不確実性評価手法の評価を行った。
本稿では,推論指向モデルに基づく行動特徴に基づく,新しい軽量な手法を提案する。
以上の結果から,不確実性はモノリシックな性質ではなく,臨床専門性や質問タイプに依存していることが明らかとなった。
論文 参考訳(メタデータ) (2025-06-12T14:48:25Z) - Risk-Sensitive Conformal Prediction for Catheter Placement Detection in Chest X-rays [0.0]
胸部X線におけるカテーテルと線位置検出のための新しいアプローチを提案する。
我々のモデルは同時に分類、セグメンテーション、ランドマーク検出を行う。
リスクに敏感なコンフォメーション予測は、統計的に保証された予測セットを提供する。
論文 参考訳(メタデータ) (2025-05-28T15:47:10Z) - Towards Reliable Medical Image Segmentation by Modeling Evidential Calibrated Uncertainty [57.023423137202485]
医用画像のセグメンテーションの信頼性に関する懸念が臨床医の間で続いている。
本稿では,医療画像セグメンテーションネットワークにシームレスに統合可能な,実装が容易な基礎モデルであるDEviSを紹介する。
主観的論理理論を活用することで、医用画像分割の確率と不確実性を明示的にモデル化する。
論文 参考訳(メタデータ) (2023-01-01T05:02:46Z) - Novel structural-scale uncertainty measures and error retention curves:
application to multiple sclerosis [9.295643448425182]
磁気共鳴画像(MRI)における白質病変(WML)セグメンテーションの不確実性評価に焦点をあてる。
一方、ボクセルスケールのセグメンテーションエラーは、病変の誤行を引き起こすが、他方では、病変サイズの検出エラーは、間違った病変数を引き起こす。
本研究の目的は, セグメンテーションと病変検出に関する誤差をそれぞれ捉えるために, 異なるボクセルと病変スケールの不確実性対策の能力を比較することである。
論文 参考訳(メタデータ) (2022-11-09T11:53:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。