論文の概要: Credal and Interval Deep Evidential Classifications
- arxiv url: http://arxiv.org/abs/2512.05526v1
- Date: Fri, 05 Dec 2025 08:37:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-13 22:40:56.960979
- Title: Credal and Interval Deep Evidential Classifications
- Title(参考訳): 死亡・死亡・死亡・死亡・死亡・死亡・死亡・死亡・死亡・死亡・死亡・死亡・死亡・死亡・死亡・死亡・死亡・死亡
- Authors: Michele Caprio, Shireen K. Manchingal, Fabio Cuzzolin,
- Abstract要約: 人工知能(AI)分野における不確実性定量化(UQ)の課題
分類タスクにおけるUQに対処するための新しいアプローチとして,Credal and Interval Deep Evidential Classifications (CDEC, IDEC) を紹介する。
- 参考スコア(独自算出の注目度): 7.698175457686475
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Uncertainty Quantification (UQ) presents a pivotal challenge in the field of Artificial Intelligence (AI), profoundly impacting decision-making, risk assessment and model reliability. In this paper, we introduce Credal and Interval Deep Evidential Classifications (CDEC and IDEC, respectively) as novel approaches to address UQ in classification tasks. CDEC and IDEC leverage a credal set (closed and convex set of probabilities) and an interval of evidential predictive distributions, respectively, allowing us to avoid overfitting to the training data and to systematically assess both epistemic (reducible) and aleatoric (irreducible) uncertainties. When those surpass acceptable thresholds, CDEC and IDEC have the capability to abstain from classification and flag an excess of epistemic or aleatoric uncertainty, as relevant. Conversely, within acceptable uncertainty bounds, CDEC and IDEC provide a collection of labels with robust probabilistic guarantees. CDEC and IDEC are trained using standard backpropagation and a loss function that draws from the theory of evidence. They overcome the shortcomings of previous efforts, and extend the current evidential deep learning literature. Through extensive experiments on MNIST, CIFAR-10 and CIFAR-100, together with their natural OoD shifts (F-MNIST/K-MNIST, SVHN/Intel, TinyImageNet), we show that CDEC and IDEC achieve competitive predictive accuracy, state-of-the-art OoD detection under epistemic and total uncertainty, and tight, well-calibrated prediction regions that expand reliably under distribution shift. An ablation over ensemble size further demonstrates that CDEC attains stable uncertainty estimates with only a small ensemble.
- Abstract(参考訳): 不確実性定量化(UQ)は人工知能(AI)分野において重要な課題であり、意思決定、リスク評価、モデルの信頼性に大きな影響を与えている。
本稿では,Credal and Interval Deep Evidential Classifications (CDEC, IDEC) を,分類タスクにおけるUQに対処するための新しいアプローチとして紹介する。
CDEC と IDEC は,それぞれクローズドと凸の確率の組)と明らかな予測分布の間隔を利用して,トレーニングデータへの過度な適合を回避し,難治性(可逆性)と難治性(非可逆性)の両不確かさを系統的に評価する。
許容しきい値を超えると、CDECとIDECは、関連するように、分類を棄却し、てんかんまたはアレタリック不確実性の過剰をフラグする能力を持つ。
逆に、許容される不確実性の範囲内で、CDECとIDECは堅牢な確率的保証を持つラベルのコレクションを提供する。
CDECとIDECは標準バックプロパゲーションとエビデンス理論から導かれる損失関数を用いて訓練される。
彼らは過去の努力の欠点を克服し、現在の明らかなディープラーニング文学を拡張した。
MNIST, CIFAR-10, CIFAR-100の広範な実験を通じて, 天然のOoDシフト(F-MNIST/K-MNIST, SVHN/Intel, TinyImageNet)とともに, CDECとIDECが競合予測精度, 疫学および全不確実性下での最先端のOoD検出, 分布シフト下で確実に拡大する厳密で校正された予測領域を示す。
アンサンブルサイズに対するアブレーションは、CDECが小さなアンサンブルのみで安定した不確実性推定を達成することを示す。
関連論文リスト
- Credal Ensemble Distillation for Uncertainty Quantification [12.36665123584814]
本研究では, 深部アンサンブルを1つのモデル CREDIT に圧縮し, 分類処理を行うフレームワークとして, クレダルアンサンブル蒸留法を提案する。
CEDは、いくつかの既存のベースラインよりも優れた、あるいは同等の不確実性推定を実現し、深いアンサンブルよりも推論オーバーヘッドを大幅に削減する。
論文 参考訳(メタデータ) (2025-11-14T14:53:42Z) - Adaptive Individual Uncertainty under Out-Of-Distribution Shift with Expert-Routed Conformal Prediction [8.306260695214972]
信頼度の高い適応区間(TESSERA)のスケールド推定を用いた信頼度エキスパートスプリット・コンフォーマルを導入する。
TESSERAは、絶対誤差を追跡する信頼性の高いカバレッジ保証、情報的かつ適応的な予測間隔幅を備えたサンプル単位の不確実性を提供する。
タンパク質-リガンド結合親和性予測は, 独立および同一分布 (d.d.) と足場ベースアウト・オブ・ディストリビューション (OOD) の双方で評価した。
論文 参考訳(メタデータ) (2025-10-17T01:51:33Z) - COIN: Uncertainty-Guarding Selective Question Answering for Foundation Models with Provable Risk Guarantees [51.5976496056012]
COINは、統計的に有効な閾値を校正し、質問毎に1つの生成された回答をフィルタリングする不確実性保護選択フレームワークである。
COINはキャリブレーションセット上で経験的誤差率を推定し、信頼区間法を適用して真誤差率に高い確率上界を確立する。
リスク管理におけるCOINの堅牢性,許容回答を維持するための強いテストタイムパワー,キャリブレーションデータによる予測効率を実証する。
論文 参考訳(メタデータ) (2025-06-25T07:04:49Z) - Deciding When Not to Decide: Indeterminacy-Aware Intrusion Detection with NeutroSENSE [0.0]
NeutroSENSEは、IoT環境における侵入検出を解釈するためのニュートロゾフィックのアンサンブルフレームワークである。
システムは予測信頼を真理(T)、虚偽(F)、不確定性(I)に分解し、不確実な定量化と棄却を可能にする。
論文 参考訳(メタデータ) (2025-06-05T11:43:31Z) - Trust, or Don't Predict: Introducing the CWSA Family for Confidence-Aware Model Evaluation [0.0]
信頼性重み付き選択精度(CWSA)と正規化変種CWSA+を紹介する。
CWSAは、信頼しきい値の下で予測モデルを評価するための原則的で解釈可能な方法を提供する。
CWSAとCWSA+は、信頼度の高いテストにおいて、ニュアンスド障害モードを効果的に検出し、古典的な指標より優れていることを示す。
論文 参考訳(メタデータ) (2025-05-24T10:07:48Z) - TrustLoRA: Low-Rank Adaptation for Failure Detection under Out-of-distribution Data [62.22804234013273]
本稿では,共変量および意味的シフトの両条件下での拒絶による分類を統一し,促進する,単純な故障検出フレームワークを提案する。
キーとなる洞察は、障害固有の信頼性知識を低ランクアダプタで分離し、統合することにより、障害検出能力を効果的かつ柔軟に向上できるということです。
論文 参考訳(メタデータ) (2025-04-20T09:20:55Z) - ConU: Conformal Uncertainty in Large Language Models with Correctness Coverage Guarantees [68.33498595506941]
自己整合性理論に基づく新しい不確実性尺度を導入する。
次に,CPアルゴリズムに正当性に整合した不確かさ条件を組み込むことにより,適合性不確かさの基準を策定する。
実証的な評価は、我々の不確実性測定が過去の最先端手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-06-29T17:33:07Z) - COLEP: Certifiably Robust Learning-Reasoning Conformal Prediction via Probabilistic Circuits [21.140271657387903]
任意のブラックボックス機械学習モデルに対して,統計的に厳密な予測セットを構築する際に,等角予測の性能が向上した。
本稿では,確率回路を用いた確率論的に堅牢な学習共形予測フレームワーク(COLEP)を提案する。
CIFAR-10で9%,AwA2で14%, GTSRBで12%, CIFAR-10で9%, AwA2で14%, COLEPは12%向上した。
論文 参考訳(メタデータ) (2024-03-17T21:23:45Z) - Evaluating Probabilistic Classifiers: The Triptych [62.997667081978825]
本稿では,予測性能の異なる相補的な側面に焦点をあてた診断グラフィックのトリチチを提案し,研究する。
信頼性図は校正に対処し、受信動作特性(ROC)曲線は識別能力を診断し、マーフィー図は全体的な予測性能と価値を視覚化する。
論文 参考訳(メタデータ) (2023-01-25T19:35:23Z) - Towards Reliable Medical Image Segmentation by Modeling Evidential Calibrated Uncertainty [57.023423137202485]
医用画像のセグメンテーションの信頼性に関する懸念が臨床医の間で続いている。
本稿では,医療画像セグメンテーションネットワークにシームレスに統合可能な,実装が容易な基礎モデルであるDEviSを紹介する。
主観的論理理論を活用することで、医用画像分割の確率と不確実性を明示的にモデル化する。
論文 参考訳(メタデータ) (2023-01-01T05:02:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。