論文の概要: An Empirical Analysis of Calibration and Selective Prediction in Multimodal Clinical Condition Classification
- arxiv url: http://arxiv.org/abs/2603.02719v1
- Date: Tue, 03 Mar 2026 08:16:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-04 21:38:10.704008
- Title: An Empirical Analysis of Calibration and Selective Prediction in Multimodal Clinical Condition Classification
- Title(参考訳): 多段階臨床条件分類における校正と選択予測の実証分析
- Authors: L. Julián Lechuga López, Farah E. Shamout, Tim G. J. Rudner,
- Abstract要約: マルチラベル臨床条件分類における不確実性に基づく選択予測の信頼性を実証的に評価した。
高い標準評価基準にもかかわらず、選択的予測は性能を著しく低下させる可能性がある。
この失敗は、厳密なクラス依存の誤校正によって引き起こされ、モデルが正しい予測に高い不確実性を割り当て、誤った予測に低い不確実性を割り当てる。
- 参考スコア(独自算出の注目度): 11.640422721732756
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As artificial intelligence systems move toward clinical deployment, ensuring reliable prediction behavior is fundamental for safety-critical decision-making tasks. One proposed safeguard is selective prediction, where models can defer uncertain predictions to human experts for review. In this work, we empirically evaluate the reliability of uncertainty-based selective prediction in multilabel clinical condition classification using multimodal ICU data. Across a range of state-of-the-art unimodal and multimodal models, we find that selective prediction can substantially degrade performance despite strong standard evaluation metrics. This failure is driven by severe class-dependent miscalibration, whereby models assign high uncertainty to correct predictions and low uncertainty to incorrect ones, particularly for underrepresented clinical conditions. Our results show that commonly used aggregate metrics can obscure these effects, limiting their ability to assess selective prediction behavior in this setting. Taken together, our findings characterize a task-specific failure mode of selective prediction in multimodal clinical condition classification and highlight the need for calibration-aware evaluation to provide strong guarantees of safety and robustness in clinical AI.
- Abstract(参考訳): 人工知能システムが臨床展開に向かっているため、信頼性の高い予測行動を保証することは、安全クリティカルな意思決定タスクに不可欠である。
モデルでは、不確実な予測を人間の専門家に延期してレビューすることができる。
本研究では,マルチモーダルICUデータを用いた多ラベル臨床条件分類における不確実性に基づく選択予測の信頼性を実証的に評価する。
最先端のユニモーダルモデルとマルチモーダルモデルにおいて, 高い標準評価指標にもかかわらず, 選択的予測は性能を著しく低下させる可能性がある。
この失敗は、厳密なクラス依存の誤診によって引き起こされ、モデルでは、正しい予測に高い不確実性を割り当て、間違った予測に低い不確実性を割り当てる。
この結果から, 一般的に使用されている集計値がこれらの効果を曖昧にし, 選択的な予測行動を評価する能力に制限があることが示唆された。
本研究は, マルチモーダルな臨床条件分類における選択予測のタスク固有の障害モードを特徴とし, 臨床AIの安全性と堅牢性を保証するために, 校正意識評価の必要性を強調した。
関連論文リスト
- A systematic evaluation of uncertainty quantification techniques in deep learning: a case study in photoplethysmography signal analysis [1.6690512882610855]
ディープラーニングモデルは、臨床外の生理的パラメータを継続的に監視するために使用することができる。
実践的な測定シナリオに配備された場合、パフォーマンスが悪くなるリスクがあり、負の患者結果につながる。
ここでは、2つの臨床関連予測タスクで訓練されたモデルに対して、8つの不確実性(UQ)技術を実装する。
論文 参考訳(メタデータ) (2025-10-31T22:54:13Z) - SConU: Selective Conformal Uncertainty in Large Language Models [59.25881667640868]
SconU(Selective Conformal Uncertainity)と呼ばれる新しいアプローチを提案する。
我々は,特定の管理可能なリスクレベルで設定されたキャリブレーションの不確実性分布から,与えられたサンプルが逸脱するかどうかを決定するのに役立つ2つの共形p値を開発する。
我々のアプローチは、単一ドメインと学際的コンテキストの両方にわたる誤発見率の厳密な管理を促進するだけでなく、予測の効率を高める。
論文 参考訳(メタデータ) (2025-04-19T03:01:45Z) - Uncertainty-aware abstention in medical diagnosis based on medical texts [87.88110503208016]
本研究は,AI支援医療診断における信頼性の重要課題について論じる。
本研究は,診断に自信がなければ,診断システムによる意思決定の回避を可能にする選択予測手法に焦点をあてる。
我々は、選択予測タスクにおける信頼性を高めるための新しい最先端手法であるHUQ-2を紹介する。
論文 参考訳(メタデータ) (2025-02-25T10:15:21Z) - Evidential time-to-event prediction with calibrated uncertainty quantification [12.446406577462069]
Time-to-event分析は、臨床予後と治療勧告に関する洞察を提供する。
本稿では,時間とイベントの予測に特化して設計された明らかな回帰モデルを提案する。
我々のモデルは正確かつ信頼性の高い性能を提供し、最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2024-11-12T15:06:04Z) - SepsisLab: Early Sepsis Prediction with Uncertainty Quantification and Active Sensing [67.8991481023825]
セプシスは米国での院内死亡の主な原因である。
既存の予測モデルは通常、情報不足の少ない高品質なデータで訓練される。
限られた観察により信頼性の低い高リスク患者に対して,ロバストな能動センシングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-07-24T04:47:36Z) - Uncertainty Quantification on Clinical Trial Outcome Prediction [37.25114005044208]
本稿では,不確実性の定量化を臨床治験結果の予測に取り入れることを提案する。
私たちの主な目標は、ニュアンスドの違いを識別するモデルの能力を強化することです。
我々は目的を達成するために選択的な分類手法を採用した。
論文 参考訳(メタデータ) (2024-01-07T13:48:05Z) - Towards Reliable Medical Image Segmentation by Modeling Evidential Calibrated Uncertainty [57.023423137202485]
医用画像のセグメンテーションの信頼性に関する懸念が臨床医の間で続いている。
本稿では,医療画像セグメンテーションネットワークにシームレスに統合可能な,実装が容易な基礎モデルであるDEviSを紹介する。
主観的論理理論を活用することで、医用画像分割の確率と不確実性を明示的にモデル化する。
論文 参考訳(メタデータ) (2023-01-01T05:02:46Z) - Improving Trustworthiness of AI Disease Severity Rating in Medical
Imaging with Ordinal Conformal Prediction Sets [0.7734726150561088]
統計的に厳密な不確実性定量化の欠如は、AI結果の信頼を損なう重要な要因である。
分布自由不確実性定量化の最近の進歩は、これらの問題に対する実用的な解決策である。
本稿では, 正しい狭窄の重症度を含むことが保証される順序予測セットを形成する手法を実証する。
論文 参考訳(メタデータ) (2022-07-05T18:01:20Z) - DEUP: Direct Epistemic Uncertainty Prediction [56.087230230128185]
認識の不確実性は、学習者の知識の欠如によるサンプル外の予測エラーの一部である。
一般化誤差の予測を学習し, aleatoric uncertaintyの推定を減算することで, 認識的不確かさを直接推定する原理的アプローチを提案する。
論文 参考訳(メタデータ) (2021-02-16T23:50:35Z) - Clinical Outcome Prediction from Admission Notes using Self-Supervised
Knowledge Integration [55.88616573143478]
臨床テキストからのアウトカム予測は、医師が潜在的なリスクを見落としないようにする。
退院時の診断,手術手順,院内死亡率,長期予測は4つの一般的な結果予測対象である。
複数の公開資料から得られた患者結果に関する知識を統合するために,臨床結果の事前学習を提案する。
論文 参考訳(メタデータ) (2021-02-08T10:26:44Z) - Uncertainty estimation for classification and risk prediction on medical
tabular data [0.0]
本研究は,医療データの分類とリスク予測のための不確実性推定の理解を深めるものである。
医療などのデータ共有分野において、モデルの予測の不確実性を測定する能力は、意思決定支援ツールの改善につながる可能性がある。
論文 参考訳(メタデータ) (2020-04-13T08:46:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。