論文の概要: On the QUEST for Uncertainty Quantification via Highest Density Regions
- arxiv url: http://arxiv.org/abs/2606.19569v1
- Date: Wed, 17 Jun 2026 20:13:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:39.5236
- Title: On the QUEST for Uncertainty Quantification via Highest Density Regions
- Title(参考訳): 高密度領域による不確かさの定量化に関するQUESTについて
- Authors: Sam Goring, Tom Kuipers, Nicola Paoletti, David S. Watson,
- Abstract要約: 不確実性定量化(UQ)は、機械学習における安全クリティカルなアプリケーションにおける信頼性の高い意思決定に不可欠である。
本稿では,分散支援の最も可能性の高いサブセットの体積によって不確実性が特徴づけられる別のフレームワークを提案する。
QUEST(Quantifying Uncertainty via highest dEnSiTy region)は分布ピークにおけるルベーグ測度濃度に基づく新しいUQアプローチである。
- 参考スコア(独自算出の注目度): 5.1459761018260854
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Uncertainty quantification (UQ) is essential for reliable decision-making in safety-critical applications in probabilistic machine learning. For regression problems, dominant scalar UQ approaches - notably, those based on proper scoring rules - measure uncertainty via pointwise predictive risk. This can lead to counterintuitive results when the target statistic is not the conditional expectation. We propose an alternative framework, in which uncertainty is characterised by the volume of the most probable subset of a distribution's support. QUEST (Quantifying Uncertainty via highest dEnSiTy regions) is a novel approach to UQ based on the concentration of Lebesgue measure at a distribution's peak(s), evaluated at one or more values of a robustness parameter $α$. We establish connections between our measures and classical statistics from information theory and economics. We show that, unlike popular alternatives based on proper scoring rules, QUEST measures of epistemic and aleatoric uncertainty satisfy a set of axioms adapted from the UQ literature, including monotonicity under distributional spread and invariance to location shifts. Selective prediction benchmarks confirm that QUEST performs favourably against standard measures such as variance and differential entropy.
- Abstract(参考訳): 不確実性定量化(UQ)は確率論的機械学習における安全クリティカルな応用における信頼性の高い意思決定に不可欠である。
回帰問題に対して、支配的なスカラーUQアプローチ(特に適切なスコアリングルールに基づくもの)は、ポイントワイドな予測リスクを通じて不確実性を測定する。
これは、目標統計値が条件付き期待値でない場合に、直感的な結果をもたらす可能性がある。
本稿では,分散支援の最も可能性の高いサブセットの体積によって不確実性が特徴づけられる別のフレームワークを提案する。
QUEST (Quantifying Uncertainty via highest dEnSiTy region) は分布のピークにおけるルベーグ測度(英語版)の濃度に基づいてUQに対する新しいアプローチであり、ロバストネスパラメータ$α$の1つ以上の値で評価される。
我々は、情報理論と経済学からの古典統計と測度を結びつける。
適切なスコアリングルールに基づく一般的な代替手段とは異なり、QUESTは、分布拡散下での単調性や位置シフトへの不変性を含む、UQ文献に適合した一連の公理を満たす。
選択予測ベンチマークは、QUESTが分散や微分エントロピーなどの標準尺度に対して好適に機能することを確認した。
関連論文リスト
- An Isotropic Approach to Efficient Uncertainty Quantification with Gradient Norms [7.439615448864818]
本稿では,ニューラルネットワークの予測不確実性を定量化する軽量な手法を提案する。
予測の勾配における不確実性を表現する一階テイラー展開とパラメータ共分散に関する等方性仮定の2つの近似を用いる。
次に,各不確実性型が解答正解の予測に有用であるかどうかを,大言語モデルを用いて検討する。
論文 参考訳(メタデータ) (2026-03-31T09:13:09Z) - Entropy Alone is Insufficient for Safe Selective Prediction in LLMs [20.664633053172327]
選択予測システムは、高リスクケースでの回答を控えることで、言語モデル幻覚による害を軽減することができる。
不確実性定量化技術はしばしばそのようなケースを特定するために用いられるが、より広い選択的予測ポリシーの文脈で評価されることはほとんどない。
エントロピーに基づく不確実性手法のモデル依存的故障モードを同定し、エントロピースコアと正当性プローブ信号を組み合わせることで、信頼できない禁忌行動に対処する。
論文 参考訳(メタデータ) (2026-03-22T11:27:13Z) - Uncertainty as Feature Gaps: Epistemic Uncertainty Quantification of LLMs in Contextual Question-Answering [29.4458902836278]
本稿では,与えられたモデルの予測分布と未知の真の分布との相互エントロピーとして定義されたタスクに依存しないトークンレベルの不確実性尺度を提案する。
我々は不確実性の上限を導出し、与えられたモデルの隠された表現において意味的特徴ギャップとして解釈できることを示す。
この一般的なフレームワークを文脈的QAタスクに適用し、文脈信頼、文脈理解、誠実さの3つの特徴がこのギャップを近似していると仮定する。
論文 参考訳(メタデータ) (2025-10-03T02:09:25Z) - Uncertainty Quantification for Regression using Proper Scoring Rules [76.24649098854219]
CRPS,対数,2乗誤差,2次スコアなど,適切なスコアリングルールに基づく回帰のための統一的UQフレームワークを提案する。
実測パラメトリックな仮定に基づく不確実性尺度に対する閉形式式を導出し、モデルのアンサンブルを用いてそれらを推定する方法を示す。
合成および実世界の回帰データセットに対する広範な評価は、信頼性の高いUQ尺度を選択するためのガイダンスを提供する。
論文 参考訳(メタデータ) (2025-09-30T17:52:12Z) - Multidimensional Uncertainty Quantification via Optimal Transport [87.97146725546502]
相補的なUQ測度をベクトルに積み重ねることで,不確実性定量化(UQ)の多次元的考察を行う。
VecUQ-OTは、個々の測定が失敗しても高い効率を示す。
論文 参考訳(メタデータ) (2025-09-26T14:09:03Z) - COIN: Uncertainty-Guarding Selective Question Answering for Foundation Models with Provable Risk Guarantees [51.5976496056012]
COINは、統計的に有効な閾値を校正し、質問毎に1つの生成された回答をフィルタリングする不確実性保護選択フレームワークである。
COINはキャリブレーションセット上で経験的誤差率を推定し、信頼区間法を適用して真誤差率に高い確率上界を確立する。
リスク管理におけるCOINの堅牢性,許容回答を維持するための強いテストタイムパワー,キャリブレーションデータによる予測効率を実証する。
論文 参考訳(メタデータ) (2025-06-25T07:04:49Z) - SConU: Selective Conformal Uncertainty in Large Language Models [59.25881667640868]
SconU(Selective Conformal Uncertainity)と呼ばれる新しいアプローチを提案する。
我々は,特定の管理可能なリスクレベルで設定されたキャリブレーションの不確実性分布から,与えられたサンプルが逸脱するかどうかを決定するのに役立つ2つの共形p値を開発する。
我々のアプローチは、単一ドメインと学際的コンテキストの両方にわたる誤発見率の厳密な管理を促進するだけでなく、予測の効率を高める。
論文 参考訳(メタデータ) (2025-04-19T03:01:45Z) - Dense Uncertainty Estimation via an Ensemble-based Conditional Latent
Variable Model [68.34559610536614]
我々は、アレータリック不確実性はデータの固有の特性であり、偏見のないオラクルモデルでのみ正確に推定できると論じる。
そこで本研究では,軌道不確実性推定のためのオラクルモデルを近似するために,列車時の新しいサンプリングと選択戦略を提案する。
以上の結果から,提案手法は精度の高い決定論的結果と確実な不確実性推定の両方を達成できることが示唆された。
論文 参考訳(メタデータ) (2021-11-22T08:54:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。