論文の概要: Uncertainty Quantification for Regression: A Unified Framework based on kernel scores
- arxiv url: http://arxiv.org/abs/2510.25599v1
- Date: Wed, 29 Oct 2025 15:08:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-30 15:50:45.78046
- Title: Uncertainty Quantification for Regression: A Unified Framework based on kernel scores
- Title(参考訳): 回帰の不確実性定量化:カーネルスコアに基づく統一フレームワーク
- Authors: Christopher Bülte, Yusuf Sale, Gitta Kutyniok, Eyke Hüllermeier,
- Abstract要約: 適切なスコアリングルールに基づいて,総数,失語症およびてんかん不確実性に関する一連の尺度を導入する。
カーネルスコア特性と下流動作との明確な対応性を実証する。
実験により、これらの指標が下流のタスクに有効であることが示された。
- 参考スコア(独自算出の注目度): 39.292428768388156
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Regression tasks, notably in safety-critical domains, require proper uncertainty quantification, yet the literature remains largely classification-focused. In this light, we introduce a family of measures for total, aleatoric, and epistemic uncertainty based on proper scoring rules, with a particular emphasis on kernel scores. The framework unifies several well-known measures and provides a principled recipe for designing new ones whose behavior, such as tail sensitivity, robustness, and out-of-distribution responsiveness, is governed by the choice of kernel. We prove explicit correspondences between kernel-score characteristics and downstream behavior, yielding concrete design guidelines for task-specific measures. Extensive experiments demonstrate that these measures are effective in downstream tasks and reveal clear trade-offs among instantiations, including robustness and out-of-distribution detection performance.
- Abstract(参考訳): レジスタンスタスク、特に安全クリティカルな領域では、適切な不確実性定量化が必要であるが、文献は主に分類に重点を置いている。
本稿では,カーネルスコアに特に重点を置いて,適切なスコアリングルールに基づいて,総,総,総,総,不確実性を示す尺度群を紹介する。
このフレームワークは、よく知られたいくつかの尺度を統一し、テール感度、ロバスト性、アウト・オブ・ディストリビューション応答性などの振る舞いがカーネルの選択によって管理される新しいものの設計のための原則化されたレシピを提供する。
本稿では,カーネルスコア特性とダウンストリーム動作との明確な対応性を証明し,タスク固有測度に関する具体的な設計ガイドラインを導出する。
大規模な実験により、これらの指標が下流作業に有効であることが示され、ロバスト性やアウト・オブ・ディストリビューション検出性能など、インスタンス間の明確なトレードオフが明らかになった。
関連論文リスト
- A Novel Framework for Uncertainty Quantification via Proper Scores for Classification and Beyond [1.5229257192293202]
本稿では,機械学習における不確実性定量化のための新しい枠組みを提案する。
具体的には、カーネルベースの適切なスコアであるカーネルスコアを用いて、サンプルベースの生成モデルを評価する。
キャリブレーション・シャープネスの分解を分類を超えて一般化し、適切なキャリブレーション誤差の定義を動機付ける。
論文 参考訳(メタデータ) (2025-08-25T13:11:03Z) - Uncertainty Quantification with Proper Scoring Rules: Adjusting Measures to Prediction Tasks [19.221081896134567]
本研究では,(厳密な)適切なスコアリング規則,特定の種類の損失関数を,分散成分とエントロピー成分に分解して不確実性の尺度を提案する。
これは不確実性定量化のための柔軟なフレームワークをもたらし、異なる損失(スコアリングルール)でインスタンス化できる。
この柔軟性は確かに有利であることを示し、特に、選択予測のタスクを分析し、スコアリングルールがタスクの損失と理想的に一致することを示します。
論文 参考訳(メタデータ) (2025-05-28T16:22:53Z) - Advancing Embodied Agent Security: From Safety Benchmarks to Input Moderation [52.83870601473094]
エンボディード・エージェントは、複数のドメインにまたがって大きな潜在能力を示す。
既存の研究は主に、一般的な大言語モデルのセキュリティに重点を置いている。
本稿では, エンボディエージェントの保護を目的とした新しい入力モデレーションフレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-22T08:34:35Z) - SConU: Selective Conformal Uncertainty in Large Language Models [59.25881667640868]
SconU(Selective Conformal Uncertainity)と呼ばれる新しいアプローチを提案する。
我々は,特定の管理可能なリスクレベルで設定されたキャリブレーションの不確実性分布から,与えられたサンプルが逸脱するかどうかを決定するのに役立つ2つの共形p値を開発する。
我々のアプローチは、単一ドメインと学際的コンテキストの両方にわたる誤発見率の厳密な管理を促進するだけでなく、予測の効率を高める。
論文 参考訳(メタデータ) (2025-04-19T03:01:45Z) - Segmentation Re-thinking Uncertainty Estimation Metrics for Semantic Segmentation [12.532289778772185]
セマンティックセグメンテーションは機械学習の基本的な応用である。
画像セグメンテーションタスクにおけるエントロピーに基づく不確実性を評価するための特殊なツールとしてPAvPU(パッチ精度対パッチ不確実性)が開発された。
本研究は,PAvPUフレームワークの中核となる3つの欠陥を同定し,ロバストな解を提案する。
論文 参考訳(メタデータ) (2024-03-28T20:34:02Z) - From Risk to Uncertainty: Generating Predictive Uncertainty Measures via Bayesian Estimation [5.355925496689674]
私たちは、異なる予測の不確実性対策を作成できるフレームワークを構築します。
本手法は,分布外および誤分類インスタンスの検出において,その性能を評価することにより,画像データセット上での検証を行う。
論文 参考訳(メタデータ) (2024-02-16T14:40:22Z) - Likelihood Ratio Confidence Sets for Sequential Decision Making [51.66638486226482]
確率に基づく推論の原理を再検討し、確率比を用いて妥当な信頼シーケンスを構築することを提案する。
本手法は, 精度の高い問題に特に適している。
提案手法は,オンライン凸最適化への接続に光を当てることにより,推定器の最適シーケンスを確実に選択する方法を示す。
論文 参考訳(メタデータ) (2023-11-08T00:10:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。