論文の概要: Anytime-Valid Conformal Risk Control
- arxiv url: http://arxiv.org/abs/2602.04364v1
- Date: Wed, 04 Feb 2026 09:39:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-05 19:45:11.459222
- Title: Anytime-Valid Conformal Risk Control
- Title(参考訳): Anytime-Valid Conformal Risk Control
- Authors: Bror Hultberg, Dave Zachariah, Antônio H. Ribeiro,
- Abstract要約: 共形予測とリスク制御は、統計的に有効なエラー制御を計算的に効率的に示す予測セットを生成することができる。
任意の時点において累積的に増大するキャリブレーションデータセットに対して高い確率で有効となるように制御を拡張した。
- 参考スコア(独自算出の注目度): 9.475553038511336
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Prediction sets provide a means of quantifying the uncertainty in predictive tasks. Using held out calibration data, conformal prediction and risk control can produce prediction sets that exhibit statistically valid error control in a computationally efficient manner. However, in the standard formulations, the error is only controlled on average over many possible calibration datasets of fixed size. In this paper, we extend the control to remain valid with high probability over a cumulatively growing calibration dataset at any time point. We derive such guarantees using quantile-based arguments and illustrate the applicability of the proposed framework to settings involving distribution shift. We further establish a matching lower bound and show that our guarantees are asymptotically tight. Finally, we demonstrate the practical performance of our methods through both simulations and real-world numerical examples.
- Abstract(参考訳): 予測セットは、予測タスクの不確実性を定量化する手段を提供する。
保持されたキャリブレーションデータを用いて、共形予測とリスク制御は、統計的に有効なエラー制御を計算的に効率よく示す予測セットを生成することができる。
しかし、標準的な定式化では、誤差は固定サイズの多くの可能なキャリブレーションデータセットに対して平均的にのみ制御される。
本稿では,任意の時点において累積的に増大するキャリブレーションデータセットに対して,高い確率で有効となるように制御を拡張した。
このような保証をQuantile-based argumentsを用いて導き、分散シフトを含む設定への提案フレームワークの適用性を示す。
さらに、一致した下限を確立し、保証が漸近的に厳密であることを示す。
最後に,シミュレーションと実世界の数値例を用いて,本手法の実用性能を実証する。
関連論文リスト
- Non-exchangeable Conformal Prediction with Optimal Transport: Tackling Distribution Shifts with Unlabeled Data [13.788274786492286]
コンフォーマル予測は、分散のない不確実性定量化手法であり、機械学習コミュニティで人気を博している。
最も一般的な変種であるスプリット共形予測は、モデルがまだ見ていないキャリブレーションデータに基づくモデル予測の統計を収集するため、計算的に効率的である。
対象範囲の損失を推定し,任意の分布シフトを緩和し,原理的かつ広く適用可能なソリューションを提供することが可能であることを示す。
論文 参考訳(メタデータ) (2025-07-14T16:10:55Z) - COIN: Uncertainty-Guarding Selective Question Answering for Foundation Models with Provable Risk Guarantees [51.5976496056012]
COINは、統計的に有効な閾値を校正し、質問毎に1つの生成された回答をフィルタリングする不確実性保護選択フレームワークである。
COINはキャリブレーションセット上で経験的誤差率を推定し、信頼区間法を適用して真誤差率に高い確率上界を確立する。
リスク管理におけるCOINの堅牢性,許容回答を維持するための強いテストタイムパワー,キャリブレーションデータによる予測効率を実証する。
論文 参考訳(メタデータ) (2025-06-25T07:04:49Z) - When Can We Reuse a Calibration Set for Multiple Conformal Predictions? [0.0]
我々は,e-conformal predictionとHoeffdingの不等式が組み合わさって,単一校正集合の繰り返し使用を可能にすることを示す。
我々は、ディープニューラルネットワークをトレーニングし、キャリブレーションセットを使用して、Hoeffdingの補正を推定する。
この補正により、修正マルコフの不等式を適用することができ、定量化された信頼度を持つ予測セットを構築することができる。
論文 参考訳(メタデータ) (2025-06-24T14:57:25Z) - Conformal Prediction Adaptive to Unknown Subpopulation Shifts [16.20577166571595]
コンフォーマル予測は、不確実な定量化を伴うブラックボックス機械学習モデルに広く用いられる。
本研究では,グループ情報が与えられていない未知のサブ集団シフトに着目した。
そこで本研究では,このような変化に適合予測を適切に適応させる新しい手法を提案し,サブポピュレーション構造に関する明示的な知識を必要とせずに,有効なカバレッジを確保する。
論文 参考訳(メタデータ) (2025-06-05T20:58:39Z) - Noise-Adaptive Conformal Classification with Marginal Coverage [53.74125453366155]
本稿では,ランダムラベルノイズによる交換性からの偏差を効率的に処理できる適応型共形推論手法を提案する。
本手法は,合成および実データに対して,その有効性を示す広範囲な数値実験により検証する。
論文 参考訳(メタデータ) (2025-01-29T23:55:23Z) - Semi-Supervised Risk Control via Prediction-Powered Inference [14.890609936348277]
リスク制御予測セット(RCPS)は、任意の機械学習モデルの出力を変換し、厳密なエラー率制御で予測ルールを設計するツールである。
ラベルのないデータを利用してハイパーパラメータを厳格に調整する半教師付きキャリブレーション手法を導入する。
提案手法は予測駆動型推論フレームワーク上に構築され,リスク管理タスクに慎重に適合する。
論文 参考訳(メタデータ) (2024-12-15T13:00:23Z) - Provably Reliable Conformal Prediction Sets in the Presence of Data Poisoning [53.42244686183879]
コンフォーマル予測は、モデルに依存しない、分布のない不確実性定量化を提供する。
しかし、敵が訓練データと校正データを操作した場合の毒殺攻撃では、共形予測は信頼性が低い。
信頼性予測セット (RPS): 汚染下での信頼性保証を証明可能な共形予測セットを構築するための最初の効率的な方法を提案する。
論文 参考訳(メタデータ) (2024-10-13T15:37:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。