論文の概要: Conformal Tradeoffs: Guarantees Beyond Coverage
- arxiv url: http://arxiv.org/abs/2602.18045v1
- Date: Fri, 20 Feb 2026 07:58:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-23 18:01:41.262964
- Title: Conformal Tradeoffs: Guarantees Beyond Coverage
- Title(参考訳): コンフォーマルなトレードオフ - カバレッジを越える保証
- Authors: Petrus H. Zwart,
- Abstract要約: 配置されたコンフォーマル予測器は、有限操作ウィンドウ上で稼働する長期間の意思決定基盤である。
マージのカバレッジは、デプロイメントに直面する量を特定しません。
私たちは、範囲を超えて運用の認証と計画のためのフレームワークを提供しています。
- 参考スコア(独自算出の注目度): 0.02648566468224904
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deployed conformal predictors are long-lived decision infrastructure operating over finite operational windows. The real-world question is not only ``Does the true label lie in the prediction set at the target rate?'' (marginal coverage), but ``How often does the system commit versus defer? What error exposure does it induce when it acts? How do these rates trade off?'' Marginal coverage does not determine these deployment-facing quantities: the same calibrated thresholds can yield different operational profiles depending on score geometry. We provide a framework for operational certification and planning beyond coverage with three contributions. (1) Small-Sample Beta Correction (SSBC): we invert the exact finite-sample Beta/rank law for split conformal to map a user request $(α^\star,δ)$ to a calibrated grid point with PAC-style semantics, yielding explicit finite-window coverage guarantees. (2) Calibrate-and-Audit: since no distribution-free pivot exists for rates beyond coverage, we introduce a two-stage design in which an independent audit set produces a reusable region -- label table and certified finite-window envelopes (Binomial/Beta-Binomial) for operational quantities -- commitment frequency, deferral, decisive error exposure, and commit purity -- via linear projection. (3) Geometric characterization: we describe feasibility constraints, regime boundaries (hedging vs.\ rejection), and cost-coherence conditions induced by a fixed conformal partition, explaining why operational rates are coupled and how calibration navigates their trade-offs. The output is an auditable operational menu: for a fixed scoring model, we trace attainable operational profiles across calibration settings and attach finite-window uncertainty envelopes. We demonstrate the approach on Tox21 toxicity prediction (12 endpoints) and aqueous solubility screening using AquaSolDB.
- Abstract(参考訳): 配置されたコンフォーマル予測器は、有限操作ウィンドウ上で稼働する長期間の意思決定基盤である。
現実の質問は、‘真のラベルはターゲットレートで設定された予測に含まれますか?’というだけでなく、‘システムコミットと遅延の頻度はどれくらいか?
動作した時に、どのエラー露光を誘発しますか?
マージナル・カバレッジは、これらの展開対象の量を決定していない。同じキャリブレーションされた閾値は、スコア・ジオメトリによって異なる運用プロファイルを生成することができる。
当社は,3つのコントリビューションを伴って,運用上の認証と計画を行うためのフレームワークを提供しています。
1)Small-Sample Beta Correction (SSBC): ユーザ要求の$(α^\star,δ)$を、PACスタイルのセマンティクスを持つキャリブレーショングリッドポイントにマッピングするために、正確に有限サンプルベータ/ランク法を逆転し、明示的な有限ウィンドウカバレッジを保証する。
2) Calibrate-and-Audit: 適用範囲を超える割合で分布自由なピボットは存在しないため、独立監査セットが再利用可能な領域 -- ラベルテーブルと認定有限ウィンドウエンベロープ(Binomial/Beta-Binomial) -- 運用量 -- コミットメント頻度、遅延、決定的エラー露光、コミット純度 -- をリニアプロジェクションを介して生成する2段階の設計を導入する。
(3) 幾何学的特徴: 実現可能性制約, 構造境界(ヘッジ対ヘッジ)について述べる。
固定された整合分割によって引き起こされるコストコヒーレンス条件は、なぜ運用レートが結合され、キャリブレーションがトレードオフをどのようにナビゲートするかを説明する。
出力は監査可能な操作メニューであり、固定されたスコアリングモデルでは、キャリブレーション設定で達成可能な操作プロファイルをトレースし、有限ウィンドウの不確実性エンベロープをアタッチする。
AquaSolDBを用いたTox21毒性予測(12エンドポイント)と水溶性スクリーニングのアプローチを実証する。
関連論文リスト
- Conditional Coverage Diagnostics for Conformal Prediction [47.93989136542648]
条件付きカバレッジ推定が分類問題であることを示す。
得られたメトリクスの族をターゲットカバレッジ(ERT)の過剰なリスクと呼びます。
ERTのオープンソースパッケージと、以前の条件付きカバレッジメトリクスをリリースしています。
論文 参考訳(メタデータ) (2025-12-12T18:47:39Z) - LEC: Linear Expectation Constraints for False-Discovery Control in Selective Prediction and Routing Systems [95.35293543918762]
大規模言語モデル(LLM)はしばしば信頼できない答えを生成するが、不確実性のある手法は誤った予測と完全に区別することができない。
我々は、この問題を、偽発見率(FDR)制御のレンズを通して解決し、全ての許容された予測のうち、エラーの割合が目標のリスクレベルを超えないことを保証する。
本稿では,線形期待制約を強制することで,選択予測を制約付き決定問題として再解釈するLECを提案する。
論文 参考訳(メタデータ) (2025-12-01T11:27:09Z) - Beyond Uncertainty Sets: Leveraging Optimal Transport to Extend Conformal Predictive Distribution to Multivariate Settings [0.14504054468850666]
コンフォーマル予測(CP)は、有限サンプルカバレッジを保証するモデル出力に対する不確実性集合を構成する。
最適な割り当ては、スコア空間の固定された多面体分割において一括的に一定であることを示す。
これにより、予測セット全体を魅力的に特徴付けることができ、予測セットのより深い制限に対処するための機械を提供する。
論文 参考訳(メタデータ) (2025-11-19T05:59:01Z) - Unsupervised Conformal Inference: Bootstrapping and Alignment to Control LLM Uncertainty [49.19257648205146]
生成のための教師なし共形推論フレームワークを提案する。
我々のゲートは、分断されたUPPよりも厳密で安定した閾値を提供する。
その結果は、ラベルのない、API互換の、テスト時間フィルタリングのゲートになる。
論文 参考訳(メタデータ) (2025-09-26T23:40:47Z) - COIN: Uncertainty-Guarding Selective Question Answering for Foundation Models with Provable Risk Guarantees [51.5976496056012]
COINは、統計的に有効な閾値を校正し、質問毎に1つの生成された回答をフィルタリングする不確実性保護選択フレームワークである。
COINはキャリブレーションセット上で経験的誤差率を推定し、信頼区間法を適用して真誤差率に高い確率上界を確立する。
リスク管理におけるCOINの堅牢性,許容回答を維持するための強いテストタイムパワー,キャリブレーションデータによる予測効率を実証する。
論文 参考訳(メタデータ) (2025-06-25T07:04:49Z) - Coverage-Guaranteed Speech Emotion Recognition via Calibrated Uncertainty-Adaptive Prediction Sets [0.0]
しばしば感情的な抑圧と突然のアウトバーストによって引き起こされる道路の怒りは、衝突や攻撃的な行動を引き起こすことによって道路の安全を著しく脅かす。
音声感情認識技術は、ネガティブな感情を早期に識別し、タイムリーな警告を発することにより、このリスクを軽減することができる。
本稿では,予測精度を統計的に厳格に保証するリスク制御予測フレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-24T12:26:28Z) - Distribution-free uncertainty quantification for classification under
label shift [105.27463615756733]
2つの経路による分類問題に対する不確実性定量化(UQ)に焦点を当てる。
まず、ラベルシフトはカバレッジとキャリブレーションの低下を示すことでuqを損なうと論じる。
これらの手法を, 理論上, 分散性のない枠組みで検討し, その優れた実用性を示す。
論文 参考訳(メタデータ) (2021-03-04T20:51:03Z) - Distribution-free binary classification: prediction sets, confidence
intervals and calibration [106.50279469344937]
分布自由条件における二項分類のための不確実性定量化(キャリブレーション、信頼区間、予測セット)の3つの概念について検討する。
固定幅と一様質量の両双対の双対確率に対する信頼区間を導出する。
我々の「三脚」定理の結果として、双有理確率に対するこれらの信頼区間は分布自由キャリブレーションに繋がる。
論文 参考訳(メタデータ) (2020-06-18T14:17:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。