論文の概要: Courtroom Analogy: New Perspective on Uncertainty-Aware Classification
- arxiv url: http://arxiv.org/abs/2605.25616v1
- Date: Mon, 25 May 2026 09:17:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:19.543652
- Title: Courtroom Analogy: New Perspective on Uncertainty-Aware Classification
- Title(参考訳): 法廷アナロジー:不確かさを意識した分類の新しい視点
- Authors: Taeseong Yoon, Heeyoung Kim,
- Abstract要約: 本稿では,不確実性意識の分類を,クラス固有の主張者の間で構造化された議論として概念化する,法廷アナロジーを紹介する。
裁判所パラメータを予測し,効率的かつ表現力のあるUQを実現する単一パスニューラルネットワークアーキテクチャを提案する。
我々は,MoDEXが強い理論的特性を享受し,様々なベンチマークにおいて最先端のUQ性能を実現することを実証した。
- 参考スコア(独自算出の注目度): 11.945854832533234
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Single-pass uncertainty quantification (UQ) methods for classification represent uncertainty by predicting a tractable distribution over the class probability vector. While existing approaches primarily focus on enhancing the expressiveness of this distribution, they often provide limited insight into how predictive uncertainty is structured and aggregated, resulting in weak interpretability. We introduce the courtroom analogy, which conceptualizes uncertainty-aware classification as a structured debate among class-specific advocates. Each advocate forms a probabilistic opinion, and a final verdict is reached by aggregating these opinions using input-dependent plausibility weights. In this framework, each advocate's opinion is modeled as a Dirichlet distribution whose concentration parameter is decomposed into shared evidence and class-specific advocacy. This yields a structured mixture of Dirichlet distributions with semantically interpretable parameters. To instantiate this formulation, we propose Mixture of Dirichlet EXperts (MoDEX), a single-pass neural architecture that predicts the courtroom parameters, enabling efficient and expressive UQ while explicitly modeling uncertainty aggregation. We demonstrate that MoDEX enjoys strong theoretical properties and achieves state-of-the-art UQ performance across diverse benchmarks, yielding interpretable uncertainty estimates with meaningful semantics.
- Abstract(参考訳): 分類のための単一パス不確実性定量化(UQ)法は、クラス確率ベクトル上のトラクタブル分布を予測することによって不確実性を表す。
既存のアプローチは、主にこの分布の表現性を高めることに重点を置いているが、予測の不確実性がどのように構造化され、集約され、結果として弱い解釈可能性をもたらすかという限定的な洞察を与えることが多い。
本稿では,不確実性意識の分類を,クラス固有の主張者の間で構造化された議論として概念化する,法廷アナロジーを紹介する。
それぞれの支持者は確率論的意見を形成し、最終的な判断は、入力依存の可算性重みを用いてこれらの意見を集約することで達成される。
この枠組みでは、各支持者の意見はディリクレ分布としてモデル化され、その濃度パラメータは共有エビデンスとクラス固有の擁護に分解される。
これにより、意味論的に解釈可能なパラメータを持つディリクレ分布の構造化混合が得られる。
この定式化を実現するために,裁判所パラメータを予測する単一パスニューラルネットワークであるMixture of Dirichlet Experts (MoDEX)を提案する。
我々は,MoDEXが強い理論的特性を享受し,多種多様なベンチマークにおいて最先端のUQ性能を実現し,意味論的に解釈可能な不確実性推定を行うことを示した。
関連論文リスト
- A Unified Framework for Uncertainty-Aware Explainable Artificial Intelligence: A Case Study in Power Quality Disturbance Classification [17.224114053715528]
ポストホックな説明可能なAI(XAI)メソッドは一般的に決定論的属性マップを生成するが、ベイズニューラルネットワーク(BNN)は説明よりも分布を誘導する。
本稿では,任意のリプシッツ連続帰属演算子によるBNN後部のプッシュフォワード測度として,エンフラネーション分布を定式化する。
平均, ばらつき, 変動係数, 量子化係数, 集合理論の集約測度を用いて, 説明分布を要約する演算子の一般族である不確実性認識関連属性演算子 (UA-RAO) を提案する。
論文 参考訳(メタデータ) (2026-05-20T12:46:30Z) - Efficient Credal Prediction through Decalibration [27.17944683306638]
本稿では, 相対的可能性の概念を基礎として, 断裂予測を効率的に行う方法を提案する。
提案手法は, 多様なタスクにまたがって, 高い性能でクレーダル集合を生成することを示す。
特に,TabPFNやCLIPなどのモデルに対して,致命的な予測を示す。
論文 参考訳(メタデータ) (2026-03-09T15:30:10Z) - Set-based v.s. Distribution-based Representations of Epistemic Uncertainty: A Comparative Study [15.533120446404228]
ニューラルネットワークにおける疫学的な不確実性は、一般的に2階のパラダイムを用いてモデル化される。
本稿では,2つのパラダイムを比較検討する。
論文 参考訳(メタデータ) (2026-02-26T08:36:09Z) - The Illusion of Certainty: Uncertainty quantification for LLMs fails under ambiguity [48.899855816199484]
そこで本研究では,第1の曖昧な質問応答(QA)データセットであるMAQA*とAmbigQA*を紹介する。
予測分布とアンサンブルに基づく推定器は、あいまいさの下では基本的に限定的であることを示す。
論文 参考訳(メタデータ) (2025-11-06T14:46:35Z) - Uncertainty as Feature Gaps: Epistemic Uncertainty Quantification of LLMs in Contextual Question-Answering [29.4458902836278]
本稿では,与えられたモデルの予測分布と未知の真の分布との相互エントロピーとして定義されたタスクに依存しないトークンレベルの不確実性尺度を提案する。
我々は不確実性の上限を導出し、与えられたモデルの隠された表現において意味的特徴ギャップとして解釈できることを示す。
この一般的なフレームワークを文脈的QAタスクに適用し、文脈信頼、文脈理解、誠実さの3つの特徴がこのギャップを近似していると仮定する。
論文 参考訳(メタデータ) (2025-10-03T02:09:25Z) - Cycles of Thought: Measuring LLM Confidence through Stable Explanations [53.15438489398938]
大規模言語モデル(LLM)は、様々なベンチマークで人間レベルの精度に到達し、さらに超えることができるが、不正確な応答における過度な自信は、依然として十分に文書化された障害モードである。
本稿では,LLMの不確実性を測定するためのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-05T16:35:30Z) - Prototype-based Aleatoric Uncertainty Quantification for Cross-modal
Retrieval [139.21955930418815]
クロスモーダル検索手法は、共通表現空間を共同学習することにより、視覚と言語モダリティの類似性関係を構築する。
しかし、この予測は、低品質なデータ、例えば、腐敗した画像、速いペースの動画、詳細でないテキストによって引き起こされるアレタリック不確実性のために、しばしば信頼性が低い。
本稿では, 原型に基づくAleatoric Uncertainity Quantification (PAU) フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-29T09:41:19Z) - Achieving Equalized Odds by Resampling Sensitive Attributes [13.114114427206678]
等価性の概念をほぼ満足する予測モデルを学習するためのフレキシブルなフレームワークを提案する。
この微分可能な関数は、モデルパラメータを等化奇数に向けて駆動するペナルティとして使用される。
本研究は,予測規則が本性質に反するか否かを検出するための公式な仮説テストを開発する。
論文 参考訳(メタデータ) (2020-06-08T00:18:34Z) - Nonparametric Score Estimators [49.42469547970041]
未知分布によって生成されたサンプルの集合からスコアを推定することは確率モデルの推論と学習における基本的なタスクである。
正規化非パラメトリック回帰の枠組みの下で、これらの推定器の統一的なビューを提供する。
カールフリーカーネルと高速収束による計算効果を享受する反復正規化に基づくスコア推定器を提案する。
論文 参考訳(メタデータ) (2020-05-20T15:01:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。