論文の概要: A systematic evaluation of uncertainty quantification techniques in deep learning: a case study in photoplethysmography signal analysis
- arxiv url: http://arxiv.org/abs/2511.00301v1
- Date: Fri, 31 Oct 2025 22:54:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 16:37:26.711016
- Title: A systematic evaluation of uncertainty quantification techniques in deep learning: a case study in photoplethysmography signal analysis
- Title(参考訳): 深層学習における不確実性定量化手法の体系的評価--光胸腺X線信号解析を例として
- Authors: Ciaran Bench, Oskar Pfeffer, Vivek Desai, Mohammad Moulaeifard, Loïc Coquelin, Peter H. Charlton, Nils Strodthoff, Nando Hegemann, Philip J. Aston, Andrew Thompson,
- Abstract要約: ディープラーニングモデルは、臨床外の生理的パラメータを継続的に監視するために使用することができる。
実践的な測定シナリオに配備された場合、パフォーマンスが悪くなるリスクがあり、負の患者結果につながる。
ここでは、2つの臨床関連予測タスクで訓練されたモデルに対して、8つの不確実性(UQ)技術を実装する。
- 参考スコア(独自算出の注目度): 1.6690512882610855
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In principle, deep learning models trained on medical time-series, including wearable photoplethysmography (PPG) sensor data, can provide a means to continuously monitor physiological parameters outside of clinical settings. However, there is considerable risk of poor performance when deployed in practical measurement scenarios leading to negative patient outcomes. Reliable uncertainties accompanying predictions can provide guidance to clinicians in their interpretation of the trustworthiness of model outputs. It is therefore of interest to compare the effectiveness of different approaches. Here we implement an unprecedented set of eight uncertainty quantification (UQ) techniques to models trained on two clinically relevant prediction tasks: Atrial Fibrillation (AF) detection (classification), and two variants of blood pressure regression. We formulate a comprehensive evaluation procedure to enable a rigorous comparison of these approaches. We observe a complex picture of uncertainty reliability across the different techniques, where the most optimal for a given task depends on the chosen expression of uncertainty, evaluation metric, and scale of reliability assessed. We find that assessing local calibration and adaptivity provides practically relevant insights about model behaviour that otherwise cannot be acquired using more commonly implemented global reliability metrics. We emphasise that criteria for evaluating UQ techniques should cater to the model's practical use case, where the use of a small number of measurements per patient places a premium on achieving small-scale reliability for the chosen expression of uncertainty, while preserving as much predictive performance as possible.
- Abstract(参考訳): 原則として、PPGセンサーデータを含む医療時系列に基づいてトレーニングされたディープラーニングモデルは、臨床以外の生理的パラメータを継続的に監視する手段を提供することができる。
しかし、実際の測定シナリオに配備された場合、パフォーマンスが低下し、負の患者結果がもたらされるかなりのリスクがある。
予測に伴う信頼性の高い不確実性は、モデルアウトプットの信頼性の解釈において、臨床医にガイダンスを与えることができる。
したがって、異なるアプローチの有効性を比較することは興味がある。
ここでは、心房細動(AF)検出(分類)と血圧回帰の2種類のモデルに対して、前例のない8つの不確実性定量化(UQ)手法を実装した。
これらの手法の厳密な比較を可能にするため、包括的評価手順を定式化する。
そこでは, 与えられたタスクに対して最適であるものは, 選択した不確実性, 評価基準, 評価された信頼性の尺度に依存する。
局所的なキャリブレーションと適応性を評価することで、より一般的に実装されているグローバルな信頼性指標では得られないモデル行動に関する実用的な知見が得られることがわかった。
我々は,UQ手法の評価基準は,患者1人あたりの少数の測定値を使用することで,予測性能を最大限に保ちつつ,不確実性の表現に対して小規模の信頼性を達成できるという,モデルの実用的ユースケースに適合するべきであることを強調した。
関連論文リスト
- Enhancing Safety in Diabetic Retinopathy Detection: Uncertainty-Aware Deep Learning Models with Rejection Capabilities [0.0]
糖尿病網膜症(DR)は視覚障害の主要な原因である。
深層学習モデルは網膜画像からDRを特定することに成功している。
本稿では,不確実性を考慮したディープラーニングモデルにおいて,低信頼度予測を拒否する拒否機構を含む代替手法について検討する。
論文 参考訳(メタデータ) (2025-09-26T01:47:43Z) - Evidential time-to-event prediction with calibrated uncertainty quantification [12.446406577462069]
Time-to-event分析は、臨床予後と治療勧告に関する洞察を提供する。
本稿では,時間とイベントの予測に特化して設計された明らかな回帰モデルを提案する。
我々のモデルは正確かつ信頼性の高い性能を提供し、最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2024-11-12T15:06:04Z) - Unified Uncertainty Estimation for Cognitive Diagnosis Models [70.46998436898205]
本稿では,幅広い認知診断モデルに対する統一的不確実性推定手法を提案する。
診断パラメータの不確かさをデータ・アスペクトとモデル・アスペクトに分解する。
本手法は有効であり,認知診断の不確実性に関する有用な知見を提供することができる。
論文 参考訳(メタデータ) (2024-03-09T13:48:20Z) - Empirical Validation of Conformal Prediction for Trustworthy Skin Lesions Classification [3.7305040207339286]
我々は、深層ニューラルネットワークにおける不確実性定量化を評価するために、コンフォーマル予測、モンテカルロドロップアウト、およびエビデンシャルディープラーニングアプローチを開発した。
結果: 実験結果から, 不確実性定量化はコンフォーマル予測法により著しく向上した。
我々の結論は、様々なテスト条件にまたがる整合予測の頑健で一貫した性能を強調している。
論文 参考訳(メタデータ) (2023-12-12T17:37:16Z) - Towards Reliable Medical Image Segmentation by Modeling Evidential Calibrated Uncertainty [57.023423137202485]
医用画像のセグメンテーションの信頼性に関する懸念が臨床医の間で続いている。
本稿では,医療画像セグメンテーションネットワークにシームレスに統合可能な,実装が容易な基礎モデルであるDEviSを紹介する。
主観的論理理論を活用することで、医用画像分割の確率と不確実性を明示的にモデル化する。
論文 参考訳(メタデータ) (2023-01-01T05:02:46Z) - Improving Trustworthiness of AI Disease Severity Rating in Medical
Imaging with Ordinal Conformal Prediction Sets [0.7734726150561088]
統計的に厳密な不確実性定量化の欠如は、AI結果の信頼を損なう重要な要因である。
分布自由不確実性定量化の最近の進歩は、これらの問題に対する実用的な解決策である。
本稿では, 正しい狭窄の重症度を含むことが保証される順序予測セットを形成する手法を実証する。
論文 参考訳(メタデータ) (2022-07-05T18:01:20Z) - Benchmarking Heterogeneous Treatment Effect Models through the Lens of
Interpretability [82.29775890542967]
治療のパーソナライズされた効果を見積もるのは複雑だが、普及している問題である。
ヘテロジニアス処理効果推定に関する機械学習文献の最近の進歩は、洗練されたが不透明なツールの多くを生み出した。
我々は、ポストホックな特徴重要度法を用いて、モデルの予測に影響を及ぼす特徴を特定する。
論文 参考訳(メタデータ) (2022-06-16T17:59:05Z) - Clinical Outcome Prediction from Admission Notes using Self-Supervised
Knowledge Integration [55.88616573143478]
臨床テキストからのアウトカム予測は、医師が潜在的なリスクを見落としないようにする。
退院時の診断,手術手順,院内死亡率,長期予測は4つの一般的な結果予測対象である。
複数の公開資料から得られた患者結果に関する知識を統合するために,臨床結果の事前学習を提案する。
論文 参考訳(メタデータ) (2021-02-08T10:26:44Z) - Uncertainty estimation for classification and risk prediction on medical
tabular data [0.0]
本研究は,医療データの分類とリスク予測のための不確実性推定の理解を深めるものである。
医療などのデータ共有分野において、モデルの予測の不確実性を測定する能力は、意思決定支援ツールの改善につながる可能性がある。
論文 参考訳(メタデータ) (2020-04-13T08:46:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。