論文の概要: Inadequacy of common stochastic neural networks for reliable clinical
decision support
- arxiv url: http://arxiv.org/abs/2401.13657v2
- Date: Thu, 25 Jan 2024 12:31:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-26 11:34:31.243958
- Title: Inadequacy of common stochastic neural networks for reliable clinical
decision support
- Title(参考訳): 信頼性決定支援のための共通確率ニューラルネットワークの不適切性
- Authors: Adrian Lindenmeyer, Malte Blattmann, Stefan Franke, Thomas Neumuth,
Daniel Schneider
- Abstract要約: 医療意思決定におけるAIの普及は、倫理的および安全性に関する懸念から、いまだに妨げられている。
しかし、一般的なディープラーニングアプローチは、データシフトによる過信傾向にある。
本研究は臨床応用における信頼性について考察する。
- 参考スコア(独自算出の注目度): 0.4262974002462632
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Widespread adoption of AI for medical decision making is still hindered due
to ethical and safety-related concerns. For AI-based decision support systems
in healthcare settings it is paramount to be reliable and trustworthy. Common
deep learning approaches, however, have the tendency towards overconfidence
under data shift. Such inappropriate extrapolation beyond evidence-based
scenarios may have dire consequences. This highlights the importance of
reliable estimation of local uncertainty and its communication to the end user.
While stochastic neural networks have been heralded as a potential solution to
these issues, this study investigates their actual reliability in clinical
applications. We centered our analysis on the exemplary use case of mortality
prediction for ICU hospitalizations using EHR from MIMIC3 study. For
predictions on the EHR time series, Encoder-Only Transformer models were
employed. Stochasticity of model functions was achieved by incorporating common
methods such as Bayesian neural network layers and model ensembles. Our models
achieve state of the art performance in terms of discrimination performance
(AUC ROC: 0.868+-0.011, AUC PR: 0.554+-0.034) and calibration on the mortality
prediction benchmark. However, epistemic uncertainty is critically
underestimated by the selected stochastic deep learning methods. A heuristic
proof for the responsible collapse of the posterior distribution is provided.
Our findings reveal the inadequacy of commonly used stochastic deep learning
approaches to reliably recognize OoD samples. In both methods, unsubstantiated
model confidence is not prevented due to strongly biased functional posteriors,
rendering them inappropriate for reliable clinical decision support. This
highlights the need for approaches with more strictly enforced or inherent
distance-awareness to known data points, e.g., using kernel-based techniques.
- Abstract(参考訳): 医療意思決定におけるAIの普及は、倫理的および安全性に関する懸念から、いまだに妨げられている。
医療設定におけるAIベースの意思決定支援システムでは、信頼性と信頼性が最優先される。
しかし、一般的なディープラーニングアプローチは、データシフトによる過信傾向にある。
このような証拠に基づくシナリオを超えた不適切な外挿は、恐ろしい結果をもたらす可能性がある。
このことは、ローカル不確実性の信頼性評価の重要性とエンドユーザへのコミュニケーションを強調している。
確率的ニューラルネットワークはこれらの問題の潜在的な解決策として評価されてきたが,本研究は臨床応用における実際の信頼性について検討する。
MIMIC3によるEHRを用いたICU入院患者の死亡予測の例を中心に分析を行った。
EHR時系列の予測にはEncoder-Only Transformerモデルが採用された。
モデル関数の確率性は、ベイズニューラルネットワーク層やモデルアンサンブルのような一般的な手法を取り入れることで達成された。
判別性能 (AUC ROC: 0.868+-0.011, AUC PR: 0.554+-0.034) と, 死亡予測ベンチマークのキャリブレーションについて検討した。
しかし,確率的深層学習法は認識的不確かさを過小評価している。
後方分布の責任崩壊のヒューリスティックな証明を提供する。
以上の結果から,一般の確率的深層学習手法ではoodサンプルを確実に認識できないことが明らかとなった。
両方法とも, 機能的後肢のバイアスが強いため, 信頼性の低いモデル信頼性が防止され, 信頼性の高い臨床診断支援には不適当である。
これは、カーネルベースの技術を使った既知のデータポイントに対して、より厳密な強制または固有の距離認識のアプローチの必要性を強調している。
関連論文リスト
- Trust-informed Decision-Making Through An Uncertainty-Aware Stacked Neural Networks Framework: Case Study in COVID-19 Classification [10.265080819932614]
本研究は、放射線画像から新型コロナウイルスの信頼できる分類のための、不確実性を考慮した重畳ニューラルネットワークモデルを提案する。
このモデルは、確実な正確な予測を正確に識別することに焦点を当て、不確実性を考慮したモデリングにおける重要なギャップに対処する。
このアーキテクチャはモンテカルロのドロップアウトやアンサンブル技術を含む不確実な定量化手法を統合し、予測信頼性を高める。
論文 参考訳(メタデータ) (2024-09-19T04:20:12Z) - SepsisLab: Early Sepsis Prediction with Uncertainty Quantification and Active Sensing [67.8991481023825]
セプシスは米国での院内死亡の主な原因である。
既存の予測モデルは通常、情報不足の少ない高品質なデータで訓練される。
限られた観察により信頼性の低い高リスク患者に対して,ロバストな能動センシングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-07-24T04:47:36Z) - Tractable Function-Space Variational Inference in Bayesian Neural
Networks [72.97620734290139]
ニューラルネットワークの予測不確かさを推定するための一般的なアプローチは、ネットワークパラメータに対する事前分布を定義することである。
本稿では,事前情報を組み込むスケーラブルな関数空間変動推論手法を提案する。
提案手法は,様々な予測タスクにおいて,最先端の不確実性評価と予測性能をもたらすことを示す。
論文 参考訳(メタデータ) (2023-12-28T18:33:26Z) - New Epochs in AI Supervision: Design and Implementation of an Autonomous
Radiology AI Monitoring System [5.50085484902146]
本稿では,放射線学AI分類モデルの性能を実際に監視するための新しい手法を提案する。
予測分散と時間安定性という2つの指標を提案し、AIのパフォーマンス変化のプリエンプティブアラートに使用する。
論文 参考訳(メタデータ) (2023-11-24T06:29:04Z) - Can input reconstruction be used to directly estimate uncertainty of a
regression U-Net model? -- Application to proton therapy dose prediction for
head and neck cancer patients [0.8343441027226364]
本稿では,別の直接不確実性推定法を提案し,それを回帰U-Netアーキテクチャに適用する。
本手法は頭頸部癌患者に対する陽子線量予測に応用した。
論文 参考訳(メタデータ) (2023-10-30T16:04:34Z) - Towards Reliable Medical Image Segmentation by utilizing Evidential Calibrated Uncertainty [52.03490691733464]
本稿では,医療画像セグメンテーションネットワークにシームレスに統合可能な,実装が容易な基礎モデルであるDEviSを紹介する。
主観的論理理論を利用して、医用画像分割の問題に対する確率と不確実性を明示的にモデル化する。
DeviSには不確実性を考慮したフィルタリングモジュールが組み込まれている。
論文 参考訳(メタデータ) (2023-01-01T05:02:46Z) - BayesNetCNN: incorporating uncertainty in neural networks for
image-based classification tasks [0.29005223064604074]
本稿では,標準的なニューラルネットワークをベイズニューラルネットワークに変換する手法を提案する。
本研究では,各前方パスにおいて,元のものと類似した異なるネットワークをサンプリングすることにより,予測のばらつきを推定する。
我々は、アルツハイマー病患者の脳画像の大きなコホートを用いて、我々のモデルを検証した。
論文 参考訳(メタデータ) (2022-09-27T01:07:19Z) - Improving Trustworthiness of AI Disease Severity Rating in Medical
Imaging with Ordinal Conformal Prediction Sets [0.7734726150561088]
統計的に厳密な不確実性定量化の欠如は、AI結果の信頼を損なう重要な要因である。
分布自由不確実性定量化の最近の進歩は、これらの問題に対する実用的な解決策である。
本稿では, 正しい狭窄の重症度を含むことが保証される順序予測セットを形成する手法を実証する。
論文 参考訳(メタデータ) (2022-07-05T18:01:20Z) - Improving Uncertainty Calibration via Prior Augmented Data [56.88185136509654]
ニューラルネットワークは、普遍関数近似器として機能することで、複雑なデータ分布から学習することに成功した。
彼らはしばしば予測に自信過剰であり、不正確で誤った確率的予測に繋がる。
本稿では,モデルが不当に過信である特徴空間の領域を探索し,それらの予測のエントロピーをラベルの以前の分布に対して条件的に高める手法を提案する。
論文 参考訳(メタデータ) (2021-02-22T07:02:37Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。