論文の概要: CHASE: Competing Hypotheses for Ambiguity-Aware Selective Prediction
- arxiv url: http://arxiv.org/abs/2605.01346v1
- Date: Sat, 02 May 2026 09:39:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.718926
- Title: CHASE: Competing Hypotheses for Ambiguity-Aware Selective Prediction
- Title(参考訳): CHASE: 曖昧性を考慮した選択予測のための仮説の競合
- Authors: Kartik Jhawar, Yuhao Geng, Atul N. Parikh, Lipo Wang,
- Abstract要約: CHASEは、構造化された時間的説明を明示的に比較し、決定にコミットするか、棄権するかを決定する選択的な予測フレームワークである。
真の曖昧さは、競合する仮説間のスコアギャップを崩壊させるため、CHASEはこれらの仮説マージンよりもランク対応セレクタを優先する。
標準的不確実性ベースラインと比較すると、CHASEは全体としての絶対的正確性、三方向の正確性、全体的あいまい性に整合した棄権において顕著な利得を達成している。
- 参考スコア(独自算出の注目度): 2.1707529464094555
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Standard selective prediction methods typically estimate uncertainty from the output of a single predictive branch. While effective for general uncertainty estimation, these approaches often struggle under partial observability, where local temporal evidence can be contradictory and standard confidence scores become misleading. We introduce CHASE (Competing Hypotheses for Ambiguity-Aware Selective Prediction), a selective prediction framework that explicitly compares structured temporal explanations to determine whether to commit to a decision or abstain. Because genuine ambiguity causes the score gap between competing hypotheses to collapse, CHASE optimizes a ranking-aware selector over these hypothesis margins to globally separate safe commitments from fundamentally uncertain ones. We evaluate this framework on the problem of hidden connectivity inference, utilizing a controlled, physically grounded simulator inspired by the dynamics of giant unilamellar vesicles (GUVs), alongside zero-shot qualitative transfer (without retraining or fine tuning) to representative real GUV videos. Our experiments demonstrate that explicitly reasoning over competing hypotheses provides a superior balance of metrics. Compared to canonical uncertainty baselines, CHASE achieves statistically significant gains in overall no-abstain accuracy, three-way accuracy, and overall ambiguity-aligned abstention (at 80% coverage). Specifically, it yields up to an 11.0% relative mean improvement in overall alignment, alongside up to an 8.8% relative boost in three-way accuracy in the very-high ambiguity regime. By maintaining a selective risk boundary strictly at par with the best baselines at 80% coverage, and reducing overall risk by 9.9% at 90% coverage, this framework offers a more reliable approach to decision-making under structured ambiguity.
- Abstract(参考訳): 標準選択予測法は、通常、1つの予測分岐の出力から不確実性を推定する。
一般的な不確実性推定には有効であるが、これらのアプローチは、局所的な時間的証拠が矛盾し、標準的な信頼スコアが誤解を招くような部分的観測可能性の下でしばしば苦労する。
本稿では、構造化された時間的説明を明示的に比較し、決定にコミットするか棄却するかを判断する選択的な予測フレームワークCHASEを紹介する。
真の曖昧さは、競合する仮説間のスコアギャップを崩壊させるため、CHASEは、これらの仮説マージンに対してランクを意識したセレクタを最適化し、基本的に不確実なものから安全なコミットメントを世界中に分離する。
本枠組みは,GUVビデオの非ショット定性的転送(リトレーニングや微調整を伴わない)とともに,巨大ユニラメラベシクル(GUV)のダイナミックスにインスパイアされた,制御された物理的に接地されたシミュレータを用いて,隠れ接続推論の問題について評価する。
我々の実験は、競合する仮説よりも明確な推論の方が指標のバランスが優れていることを示した。
標準的不確実性ベースラインと比較すると、CHASEは、全体的な持続的正確性、三方向的正確性、および全体曖昧性に整合した棄権(80%のカバレッジ)において統計的に有意な上昇を達成している。
具体的には、全体のアライメントにおいて最大11.0%の相対的な平均的改善が得られ、非常に高いあいまいな状態において、三方向の精度が最大8.8%向上する。
選択的なリスク境界を80%のカバレッジで厳密に維持し、90%のカバレッジで全体的なリスクを9.9%削減することで、構造的曖昧さの下での意思決定に対するより信頼性の高いアプローチを提供する。
関連論文リスト
- The Evaluation Gap in Medicine, AI and LLMs: Navigating Elusive Ground Truth & Uncertainty via a Probabilistic Paradigm [49.287792149338976]
基礎的真理解における高い確実性は、専門家でさえ高いスコアを得るのに、ほぼ常に必要であるということを理論的に説明するために確率論的パラダイムを導入する。
そこで我々は,有能な人間やシステムが与えられた真理応答の変動を推定するために,期待精度と期待F1の概念を導出する。
論文 参考訳(メタデータ) (2026-01-09T03:19:37Z) - Adaptive Conformal Prediction via Bayesian Uncertainty Weighting for Hierarchical Healthcare Data [2.922743999325622]
本稿では,医療予測の基本的な限界に対処するハイブリッドベイズ・コンフォーマル・フレームワークを提案する。
提案手法は, ベイズ系階層的ランダム林と群対応型コンフォメーションキャリブレーションを統合し, 後方不確かさを重み適合度スコアに用いた。
米国3,793の病院と4つの地域にわたる61,538件の入院状況について検討した。
論文 参考訳(メタデータ) (2026-01-03T16:06:37Z) - Calibrating Uncertainty for Zero-Shot Adversarial CLIP [33.707647228637114]
予測精度と不確実性アライメントの両方を考慮した,CLIPの新たな逆調整目標を提案する。
我々の目的は、これらの分布を摂動の下で均等に整列させ、シングルログのアンカーを超えて不確実性を回復することである。
論文 参考訳(メタデータ) (2025-12-15T05:41:08Z) - Calibrated Decomposition of Aleatoric and Epistemic Uncertainty in Deep Features for Inference-Time Adaptation [3.018583625592182]
ほとんどの推定器は、全ての不確実性モードを単一の信頼スコアに分解し、いつより多くの計算を割り当てるか、あるいは推論を調整するべきかについての信頼性の高い推論を防ぐ。
非確実性誘導推論時間選択(Uncertainty-Guided Inference-Time Selection)は,データ駆動型(データ駆動型)とモデル駆動型不確実性を,深い特徴空間で直接的に解消する軽量な推論時間フレームワークである。
論文 参考訳(メタデータ) (2025-11-15T23:47:30Z) - COIN: Uncertainty-Guarding Selective Question Answering for Foundation Models with Provable Risk Guarantees [51.5976496056012]
COINは、統計的に有効な閾値を校正し、質問毎に1つの生成された回答をフィルタリングする不確実性保護選択フレームワークである。
COINはキャリブレーションセット上で経験的誤差率を推定し、信頼区間法を適用して真誤差率に高い確率上界を確立する。
リスク管理におけるCOINの堅牢性,許容回答を維持するための強いテストタイムパワー,キャリブレーションデータによる予測効率を実証する。
論文 参考訳(メタデータ) (2025-06-25T07:04:49Z) - SConU: Selective Conformal Uncertainty in Large Language Models [59.25881667640868]
SconU(Selective Conformal Uncertainity)と呼ばれる新しいアプローチを提案する。
我々は,特定の管理可能なリスクレベルで設定されたキャリブレーションの不確実性分布から,与えられたサンプルが逸脱するかどうかを決定するのに役立つ2つの共形p値を開発する。
我々のアプローチは、単一ドメインと学際的コンテキストの両方にわたる誤発見率の厳密な管理を促進するだけでなく、予測の効率を高める。
論文 参考訳(メタデータ) (2025-04-19T03:01:45Z) - Beyond Confidence: Adaptive Abstention in Dual-Threshold Conformal Prediction for Autonomous System Perception [0.4124847249415279]
安全クリティカルな認識システムは、安全を維持するために確実な不確実性定量化と原則化された禁制機構を必要とする。
本稿では,統計的に保証された不確実性推定を提供するとともに,リスクの高いシナリオにおいて選択的な予測を可能にする,新しいデュアルスレッド整合化フレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-11T04:45:31Z) - Conformal Prediction Sets with Improved Conditional Coverage using Trust Scores [52.92618442300405]
有限サンプルにおいて、正確に分布のない条件付きカバレッジを達成することは不可能である。
本稿では,最も重要となる範囲を対象とするコンフォメーション予測アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-01-17T12:01:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。