論文の概要: A Joint Finite-Sample Certificate for Adaptive Selective Conformal Risk Control
- arxiv url: http://arxiv.org/abs/2606.08517v1
- Date: Sun, 07 Jun 2026 08:55:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.181511
- Title: A Joint Finite-Sample Certificate for Adaptive Selective Conformal Risk Control
- Title(参考訳): 適応的選択的コンフォーマルリスク制御のための連成有限サンプル証明書
- Authors: Xiaoli Yu, Jiamiao Liu,
- Abstract要約: 選択したリスクを直接比率として扱うことにより、有界、おそらくは非単調な損失の証明を与える。
1/pmin$から1/sqrtpmin$への受け入れフロア依存を鋭くする。
この証明書は、Hoeffding--CRCに対する認証受け入れフロンティアを$+22$ ppで開く。
- 参考スコア(独自算出の注目度): 0.9668407688201359
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Selective predictors answer on confident inputs and abstain elsewhere; deploying one safely needs a single finite-sample certificate that simultaneously upper-bounds the selected risk, lower-bounds the acceptance probability $\pacc$ above a floor $\pmin$, and lower-bounds the deployment utility. This certificate must be valid under adaptive threshold selection from a finite grid of $m$ pairs on $\ncert$ samples. We give such a certificate for bounded, possibly non-monotone losses by treating the selected risk directly as a ratio rather than through a Hoeffding-style range bound. The construction couples three confidence bounds: a variance-adaptive empirical-Bernstein bound on the ratio risk, a Clopper--Pearson bound on acceptance, and a two-sided closeness bound on utility. Together they lower-bound the certified policy's utility absolutely and to within $2\gammau$ of the best over the \emph{certified set}, both non-vacuous whenever feasible; a regime-scoped third leg matches an external oracle, informative only where the risk margin $\gammar < α$ and vacuous at the headline operating points. Relative to the range-only Hoeffding-ratio construction this sharpens the acceptance-floor dependence from $1/\pmin$ to $1/\sqrt{\pmin}$, and a closed-form corollary identifies a per-pair regime in which our risk bound dominates a Hoeffding conformal risk control (Hoeffding--CRC) selective bound. Empirically, on ImageNet (three ResNets) and COCO val 2017 panoptic, the certificate opens a $+22$ pp certified-acceptance frontier over Hoeffding--CRC and is ${\approx}10{\times}$ tighter than a non-vacuous matched-valid baseline; these gains are regime-scoped, not universal, and absent on ADE20K. The certifier runs in $O(\ncert m)$ time.
- Abstract(参考訳): 1つをデプロイするには、選択されたリスクを同時に上位にバウンドし、受け入れ確率を低くする$\pacc$をフロアの上に、配置ユーティリティを下位にバウンドする1つの有限サンプル証明書が必要です。
この証明書は、$\ncert$サンプル上の$m$ペアの有限グリッドから適応しきい値の選択の下で有効でなければならない。
選択したリスクを直接、ホエーディングスタイルの範囲境界を経由するのではなく、比率として扱うことで、有界、おそらくは非単調な損失の証明を与える。
構成は3つの信頼境界を結合する: 分散適応的経験的ベルンシュタインは比のリスクに縛られ、クロッパー-ピアソンは受容に拘束される。
同時に、認定された政策の効用を絶対的に低くし、かつ \emph{certified set} に対する最高額の2.\gammau$ の範囲内において、実現可能であれば、どちらも空でない; 体制にスコープされた3番目の脚は、危険マージン$\gammar < α$ と、見出しの操作ポイントにおける空白のどちらかの点のみ、外部のオラクルと一致させる。
1/\pmin$から1/\sqrt{\pmin}$への受け入れフロア依存を強くし、クローズドフォームの用語集は、我々のリスク境界がHoeffding共形リスク制御(Hoeffding--CRC)の選択的バウンダリを支配しているペア当たりの体制を特定する。
ImageNet (3つのResNets) と COCO val 2017 パン光学では、この証明書はHoeffding--CRC上で$+22$ ppの認証受け入れフロンティアを開き、非空白のマッチしたバリッドベースラインよりも${\approx}10{\times}$ tightである。
証明書は$O(\ncert m)$ timeで実行される。
関連論文リスト
- Decoupled Conformal Optimisation: Efficient Prediction Sets via Independent Tuning and Calibration [20.21455697379946]
そこで我々は,列車チューンキャリブレート設計の原則としてデカップリング・コンフォーマル最適化(DCO)を提案する。
DCOは、効率指向構造選択のために独立したチューニングスプリットと、最終共形量子化のための新鮮なキャリブレーションスプリットを使用する。
DCOは,PACスタイルのキャリブレーションに対して,平均予測セットサイズや間隔幅を小さくしながら,名目カバレッジレベルを密に追跡する。
論文 参考訳(メタデータ) (2026-05-18T13:10:21Z) - Anytime PAC-Bayes for Constrained Density-Ratio Networks under Covariate Shift [0.0]
PAC-Bayesはベルヌーイ-KL境界を生じる固定時間状態の重み付けリスクに基づいてインスタンス化される。
実データデプロイメントによる解析的基盤真理に対するパッチテストは、フレームワークを検証します。
単一の固定時間カバレッジ障害が記録され、スプリット単位のカバレッジがラベルシフトの大きさと一致している。
論文 参考訳(メタデータ) (2026-05-17T01:07:17Z) - A Closed-Form Persistence-Landmark Pipeline for Certified Point-Cloud and Graph Classification [0.0]
PLACE(Persistence-Landmark Analytic Classification Engine)は、点雲とグラフを分類するためのクローズドフォームパイプラインである。
3つの量的保証 -- マージンベースの過剰リスク率、クローズドフォーム記述子選択ルール、プレディションごとの証明書 -- は、トレーニングラベルのみから導かれる。
論文 参考訳(メタデータ) (2026-05-04T17:15:01Z) - SCOPE: Selective Conformal Optimized Pairwise LLM Judging [16.73004625486562]
大規模言語モデル (LLMs) は、コストのかかる人間の選好ラベルをペア評価で置き換えるために、裁判官としてますます使われている。
実用性にも拘わらず、LLMの審査員は、誤校正や体系的な偏見に悩まされる傾向にある。
本稿では,有限サンプル統計保証から選択的に判断するフレームワークであるSCOPEを提案する。
論文 参考訳(メタデータ) (2026-02-13T17:10:43Z) - Probabilistically Tightened Linear Relaxation-based Perturbation Analysis for Neural Network Verification [83.25968588249776]
本稿では,LiRPAに基づく手法とサンプリングに基づく手法を組み合わせることで,厳密な中間到達性集合を計算できる新しいフレームワークを提案する。
無視可能な計算オーバーヘッドでは、$textttPT-LiRPA$は推定された到達可能な集合を利用し、ニューラルネットワークの出力の上下線形境界を著しく締め付ける。
論文 参考訳(メタデータ) (2025-07-07T18:45:53Z) - Robust Conformal Prediction with a Single Binary Certificate [58.450154976190795]
コンフォーマル予測(CP)は、任意のモデルの出力を、真のラベルを(調整可能な)高い確率でカバーすることを保証した予測セットに変換する。
我々は,MCサンプルが著しく低い場合でも,より小さな集合を生成する頑健な共形予測を提案する。
論文 参考訳(メタデータ) (2025-03-07T08:41:53Z) - Theoretical guarantees on the best-of-n alignment policy [110.21094183592358]
我々は、KLの最良のn$ポリシーと参照ポリシーのKL分岐が、実際のKL分岐の上限であることを示す。
そこで本研究では,KLの発散に対する新しい推定器を提案し,その近似が厳密であることを実証的に示す。
我々は、利益率とKLの最良のn$アライメントポリシーの相違点を分析することで締めくくった。
論文 参考訳(メタデータ) (2024-01-03T18:39:13Z) - Probably Anytime-Safe Stochastic Combinatorial Semi-Bandits [81.60136088841948]
本稿では,時間軸における後悔を最小限に抑えるアルゴリズムを提案する。
提案アルゴリズムは,レコメンデーションシステムや交通機関などの分野に適用可能である。
論文 参考訳(メタデータ) (2023-01-31T03:49:00Z) - ANCER: Anisotropic Certification via Sample-wise Volume Maximization [134.7866967491167]
本稿では,与えられたテストセットのサンプルに対して,ボリュームを介して異方性証明書を取得するためのフレームワークであるanceRを紹介する。
その結果,CERはCIFAR-10とImageNetの両方で複数の半径で精度を導入し,ボリュームの面ではかなり大きな領域を認証していることがわかった。
論文 参考訳(メタデータ) (2021-07-09T17:42:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。