論文の概要: Cross-Domain Uncertainty Quantification for Selective Prediction: A Comprehensive Bound Ablation with Transfer-Informed Betting
- arxiv url: http://arxiv.org/abs/2603.08907v1
- Date: Mon, 09 Mar 2026 20:25:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-11 15:25:23.813845
- Title: Cross-Domain Uncertainty Quantification for Selective Prediction: A Comprehensive Bound Ablation with Transfer-Informed Betting
- Title(参考訳): 選択予測のためのクロスドメイン不確かさの定量化:伝達インフォームドベッティングによる包括的境界アブレーション
- Authors: Abhinaba Basu,
- Abstract要約: リスク制御による選択的予測のために,9つの有限サンプル境界ファミリーの包括的アブレーションを提案する。
我々の主要な理論的貢献はTransfer-Informed Betting (TIB) であり、ソースドメインのリスクプロファイルを使用してWSR富裕層プロセスをウォームスタートさせます。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a comprehensive ablation of nine finite-sample bound families for selective prediction with risk control, combining concentration inequalities (Hoeffding, Empirical Bernstein, Clopper-Pearson, Wasserstein DRO, CVaR) with multiple-testing corrections (union bound, Learn Then Test fixed-sequence) and betting-based confidence sequences (WSR). Our main theoretical contribution is Transfer-Informed Betting (TIB), which warm-starts the WSR wealth process using a source domain's risk profile, achieving tighter bounds in data-scarce settings with a formal dominance guarantee. We prove that the TIB wealth process remains a valid supermartingale under all source-target divergences, that TIB dominates standard WSR when domains match, and that no data-independent warm-start can achieve better convergence. The combination of betting-based confidence sequences, LTT monotone testing, and cross-domain transfer is, to our knowledge, a three-way novelty not present in the literature. We evaluate all nine bound families on four benchmarks-MASSIVE (n=1,102), NyayaBench (n=280), CLINC-150 (n=22.5K), and Banking77 (n=13K)-across 18 (alpha, delta) configurations. On MASSIVE at alpha=0.10, LTT eliminates the ln(K) union-bound penalty, achieving 94.0% guaranteed coverage versus 73.8% for Hoeffding-a 27% relative improvement. On NyayaBench, where the small calibration set makes Hoeffding-family bounds infeasible below alpha=0.20, Transfer-Informed Betting achieves 18.5% coverage at alpha=0.10, a 5.4x improvement over LTT + Hoeffding. We additionally compare with split-conformal prediction, showing that conformal methods produce prediction sets (avg. 1.67 classes) whereas selective prediction provides single-prediction risk guarantees. We apply these methods to agentic caching systems, formalizing a progressive trust model where the guarantee determines when cached responses can be served autonomously.
- Abstract(参考訳): 本研究では,9つの有限サンプル境界系に対して,集中不等式 (Hoeffding, Empirical Bernstein, Clopper-Pearson, Wasserstein DRO, CVaR) と多重検定補正 (union bound, Learn Then Test fixed-sequence) とベッティングベースの信頼シーケンス (WSR) を組み合わせ,リスク管理による選択的予測のための包括的アブレーションを提案する。
我々の主要な理論的貢献はTransfer-Informed Betting (TIB) であり、これはソースドメインのリスクプロファイルを使用してWSRの富裕層プロセスを暖かく開始し、正式な優位性を保証するデータスカース設定においてより厳密な境界を達成します。
我々は、TIBの富のプロセスが、すべてのソースターゲットの分岐の下で有効なスーパーマーチングリーであり、ドメインが一致したときには、TIBが標準WSRを支配し、データ非依存のウォームスタートがより良い収束を達成できないことを証明した。
ベッティングに基づく信頼シーケンス,NTT単調テスト,クロスドメイン転送の組み合わせは,文献に存在しない3方向の新規性である。
我々は,MASSIVE (n=1,102), NyayaBench (n=280), CLINC-150 (n=22.5K), Banking77 (n=13K)-across 18 (alpha, delta) の4つのベンチマークで,9つの境界系を評価した。
アルファ=0.10のMASSIVEでは、LTTはln(K)結合制限のペナルティを排除し、94.0%のカバレッジが保証され、Hueffdingは73.8%、相対的な改善は27%である。
ニヤヤベンチでは、小さなキャリブレーションセットによって、Hueffdingファミリーの境界がα=0.20以下では実現できないため、Transfer-Informed Bettingはα=0.10で18.5%のカバレッジを獲得し、LTT+Hoeffdingよりも5.4倍改善されている。
さらに,共形手法が予測セット(約1.67クラス)を生成するのに対して,選択予測は単一予測のリスク保証を提供することを示す。
これらの手法をエージェントキャッシュシステムに適用し、キャッシュされた応答を自律的に提供できるかどうかを保証するプログレッシブ信頼モデルを定式化する。
関連論文リスト
- Bayesian Transformer for Probabilistic Load Forecasting in Smart Grids [0.0]
本研究では,3つの相補的不確実性機構をPatchTSTバックボーンに統合したベイズ変圧器フレームワークを提案する。
7段階のマルチクエンタリーピンボールロス予測ヘッドと、訓練後の等音波回帰キャリブレーションにより、鋭く、ほぼ一意にカバーされた予測間隔が生成される。
主要なベンチマーク(PJM, H=24h)では、BTは0.0289のCRPSを達成し、Deep Ensemblesより7.4%、決定論的LSTMより29.9%改善した。
論文 参考訳(メタデータ) (2026-03-09T02:39:51Z) - ST-BCP: Tightening Coverage Bound for Backward Conformal Prediction via Non-Conformity Score Transformation [18.272247805086284]
コンフォーマル予測(CP)は、カバレッジ保証付き予測セットを構成する不確実性定量化のための統計フレームワークを提供する。
BCPはこのパラダイムを逆転させ、セットサイズに事前定義された上限を強制し、その結果のカバレッジ保証を推定する。
本稿では,非整合性スコアのデータ依存変換を導入し,カバレッジギャップを狭める新しい方法ST-BCPを紹介する。
論文 参考訳(メタデータ) (2026-02-02T07:18:35Z) - Semantic-Constrained Federated Aggregation: Convergence Theory and Privacy-Utility Bounds for Knowledge-Enhanced Distributed Learning [0.0]
本稿では,ドメイン知識の制約を分散最適化に組み込んだ理論的な基盤を持つフレームワークであるSemantic-Constrained Federated Aggregation(SCFA)を紹介する。
我々は、制約違反率を表す SCFA 収束率 O(1/sqrt(T) + rho) を証明し、制約に基づく連邦学習のための最初の収束理論を確立する。
我々は,Boschの生産データを用いて,118万サンプルと968のセンサ機能を備えた予測保守の枠組みを検証した。
論文 参考訳(メタデータ) (2025-12-12T04:29:29Z) - LEC: Linear Expectation Constraints for False-Discovery Control in Selective Prediction and Routing Systems [95.35293543918762]
大規模言語モデル(LLM)はしばしば信頼できない答えを生成するが、不確実性のある手法は誤った予測と完全に区別することができない。
我々は、この問題を、偽発見率(FDR)制御のレンズを通して解決し、全ての許容された予測のうち、エラーの割合が目標のリスクレベルを超えないことを保証する。
本稿では,線形期待制約を強制することで,選択予測を制約付き決定問題として再解釈するLECを提案する。
論文 参考訳(メタデータ) (2025-12-01T11:27:09Z) - Formal Models and Convergence Analysis for Context-Aware Security Verification [0.0]
本稿では,ML強化適応システムに対する証明可能な保証を確立する,文脈認識型セキュリティ検証のための公式なフレームワークを提案する。
1)適応的検証が成功した場合のサンプル複雑性境界,(2)コンテキストリッチネスと検出能力に関する情報理論制限,(3)MLベースのペイロードジェネレータの収束保証。
論文 参考訳(メタデータ) (2025-10-14T12:21:36Z) - Conformal Prediction for Privacy-Preserving Machine Learning [83.88591755871734]
AESで暗号化されたMNISTデータセットの変種を用いて、暗号化されたドメインに直接適用しても、コンフォーマル予測法が有効であることを示す。
我々の研究は、安全でプライバシーに配慮した学習システムにおける原則的不確実性定量化の基礎を定めている。
論文 参考訳(メタデータ) (2025-07-13T15:29:14Z) - COIN: Uncertainty-Guarding Selective Question Answering for Foundation Models with Provable Risk Guarantees [51.5976496056012]
COINは、統計的に有効な閾値を校正し、質問毎に1つの生成された回答をフィルタリングする不確実性保護選択フレームワークである。
COINはキャリブレーションセット上で経験的誤差率を推定し、信頼区間法を適用して真誤差率に高い確率上界を確立する。
リスク管理におけるCOINの堅牢性,許容回答を維持するための強いテストタイムパワー,キャリブレーションデータによる予測効率を実証する。
論文 参考訳(メタデータ) (2025-06-25T07:04:49Z) - Robust Conformal Prediction with a Single Binary Certificate [58.450154976190795]
コンフォーマル予測(CP)は、任意のモデルの出力を、真のラベルを(調整可能な)高い確率でカバーすることを保証した予測セットに変換する。
我々は,MCサンプルが著しく低い場合でも,より小さな集合を生成する頑健な共形予測を提案する。
論文 参考訳(メタデータ) (2025-03-07T08:41:53Z) - Equal Opportunity of Coverage in Fair Regression [50.76908018786335]
我々は、予測の不確実性の下で公正な機械学習(ML)を研究し、信頼性と信頼性のある意思決定を可能にする。
本研究は,(1)類似した結果の異なる集団に対するカバー率が近いこと,(2)人口全体のカバー率が一定水準にあること,の2つの特性を達成することを目的としたカバーの平等機会(EOC)を提案する。
論文 参考訳(メタデータ) (2023-11-03T21:19:59Z) - Learning Calibrated Uncertainties for Domain Shift: A Distributionally
Robust Learning Approach [150.8920602230832]
ドメインシフトの下で校正された不確実性を学習するためのフレームワークを提案する。
特に、密度比推定は、ターゲット(テスト)サンプルの近さをソース(トレーニング)分布に反映する。
提案手法は下流タスクに有利な校正不確実性を生成する。
論文 参考訳(メタデータ) (2020-10-08T02:10:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。