論文の概要: Online Conformal Prediction with Adversarial Semi-bandit Feedback via Regret Minimization
- arxiv url: http://arxiv.org/abs/2604.17984v1
- Date: Mon, 20 Apr 2026 09:07:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.782422
- Title: Online Conformal Prediction with Adversarial Semi-bandit Feedback via Regret Minimization
- Title(参考訳): レギュレット最小化による逆半帯域フィードバックによるオンラインコンフォーマル予測
- Authors: Junyoung Yang, Kyungmin Kim, Sangdon Park,
- Abstract要約: 不確実性定量化は、不確実性の下で決定を下さなければならない安全クリティカルなシステムにおいて重要である。
オンライン共形予測は、各段階における予測セットを動的に構築する、原則化されたオンライン不確実性定量化手法である。
本稿では,適応的相手からのフィードバックを部分的に受けて,オンライン共形予測のための新しい学習手法を提案する。
- 参考スコア(独自算出の注目度): 7.4627679994408735
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Uncertainty quantification is crucial in safety-critical systems, where decisions must be made under uncertainty. In particular, we consider the problem of online uncertainty quantification, where data points arrive sequentially. Online conformal prediction is a principled online uncertainty quantification method that dynamically constructs a prediction set at each time step. While existing methods for online conformal prediction provide long-run coverage guarantees without any distributional assumptions, they typically assume a full feedback setting in which the true label is always observed. In this paper, we propose a novel learning method for online conformal prediction with partial feedback from an adaptive adversary-a more challenging setup where the true label is revealed only when it lies inside the constructed prediction set. Specifically, we formulate online conformal prediction as an adversarial bandit problem by treating each candidate prediction set as an arm. Building on an existing algorithm for adversarial bandits, our method achieves a long-run coverage guarantee by explicitly establishing its connection to the regret of the learner. Finally, we empirically demonstrate the effectiveness of our method in both independent and identically distributed (i.i.d.) and non-i.i.d. settings, showing that it successfully controls the miscoverage rate while maintaining a reasonable size of the prediction set.
- Abstract(参考訳): 不確実性定量化は、不確実性の下で決定を下さなければならない安全クリティカルなシステムにおいて重要である。
特に,データポイントが順次到着するオンライン不確実性定量化の問題を考える。
オンライン共形予測は、各段階における予測セットを動的に構築する、原則化されたオンライン不確実性定量化手法である。
オンライン共形予測の既存の手法は、分布的な仮定なしに長期にわたるカバレッジ保証を提供するが、彼らは通常、真のラベルが常に観察される完全なフィードバック設定を仮定する。
本稿では,構築した予測セット内にある場合にのみ真のラベルが明らかになるような,適応的な逆方向からの部分的なフィードバックを伴うオンラインコンフォメーション予測のための新しい学習手法を提案する。
具体的には,各候補予測セットをアームとして扱うことにより,オンライン共形予測を逆帯域問題として定式化する。
提案手法は,既存手法をベースとして,学習者の後悔へのつながりを明確にし,長期にわたるカバレッジ保証を実現する。
最後に,本手法の有効性を,独立および同一分布(i.d.)および非i.d.設定の両方において実証的に実証し,予測セットの妥当なサイズを維持しつつ,誤発見率の制御に成功したことを示す。
関連論文リスト
- Distribution-informed Online Conformal Prediction [53.674678995825666]
更新ルールに基礎となるデータパターンを組み込んだオンラインコンフォメーション予測アルゴリズムである Conformal Optimistic Prediction (COP) を提案する。
COPは予測可能なパターンが存在する場合により厳密な予測セットを生成し、見積もりが不正確な場合でも有効なカバレッジ保証を保持する。
我々は,COPが有効なカバレッジを実現し,他のベースラインよりも短い予測間隔を構築できることを証明した。
論文 参考訳(メタデータ) (2025-12-08T17:51:49Z) - SConU: Selective Conformal Uncertainty in Large Language Models [59.25881667640868]
SconU(Selective Conformal Uncertainity)と呼ばれる新しいアプローチを提案する。
我々は,特定の管理可能なリスクレベルで設定されたキャリブレーションの不確実性分布から,与えられたサンプルが逸脱するかどうかを決定するのに役立つ2つの共形p値を開発する。
我々のアプローチは、単一ドメインと学際的コンテキストの両方にわたる誤発見率の厳密な管理を促進するだけでなく、予測の効率を高める。
論文 参考訳(メタデータ) (2025-04-19T03:01:45Z) - Online Conformal Probabilistic Numerics via Adaptive Edge-Cloud Offloading [52.499838151272016]
本研究は, PLS が生成する HPD 集合を, 長期のカバレッジ要件を保証するため, キャリブレーションする手法を提案する。
提案手法は,クラウドからエッジへの散発的なフィードバックを前提としたオンライン共形予測PLS (OCP-PLS) と呼ばれる。
OCP-PLSの有効性は、カバレッジ、予測セットサイズ、クラウド利用のトレードオフに関する洞察をもたらす実験を通じて検証される。
論文 参考訳(メタデータ) (2025-03-18T17:30:26Z) - Conformalized Interactive Imitation Learning: Handling Expert Shift and Intermittent Feedback [26.87212135255959]
インタラクティブな模倣学習(IL)では、不確実性定量化は、学習者(つまりロボット)がデプロイメント中に遭遇する分散シフトと競合する方法を提供する。
ConformalDAgger は,IQT で校正された予測間隔を,展開時間不確実性の信頼性の高い尺度として用いる新しい手法である。
7DOFロボットマニピュレータ上でのシミュレーションおよびハードウェア展開において、ConformalDAggerはエキスパートがシフトする際に高い不確実性を検出する。
論文 参考訳(メタデータ) (2024-10-11T14:27:56Z) - Online scalable Gaussian processes with conformal prediction for guaranteed coverage [32.21093722162573]
結果として生じる不確実な値の整合性は、学習関数がGPモデルで指定された特性に従うという前提に基づいている。
提案するGPは,分散のない後処理フレームワークである共形予測(CP)を用いて,有意なカバレッジで予測セットを生成する。
論文 参考訳(メタデータ) (2024-10-07T19:22:15Z) - Robust Conformal Prediction Using Privileged Information [17.886554223172517]
本研究では,トレーニングデータの破損に対して堅牢な,保証されたカバレッジ率で予測セットを生成する手法を開発した。
我々のアプローチは、i.d仮定の下で有効となる予測セットを構築するための強力なフレームワークである共形予測に基づいている。
論文 参考訳(メタデータ) (2024-06-08T08:56:47Z) - Improved Online Conformal Prediction via Strongly Adaptive Online
Learning [86.4346936885507]
我々は、強い適応的後悔を最小限に抑える新しいオンライン共形予測手法を開発した。
提案手法は,すべての区間において,ほぼ最適に適応的な後悔を同時に達成できることを実証する。
実験により,本手法は実世界のタスクにおける既存の手法よりも,より優れたカバレッジと予測セットが得られることがわかった。
論文 参考訳(メタデータ) (2023-02-15T18:59:30Z) - Private Prediction Sets [72.75711776601973]
機械学習システムは、個人のプライバシーの確実な定量化と保護を必要とする。
これら2つのデシラタを共同で扱う枠組みを提案する。
本手法を大規模コンピュータビジョンデータセット上で評価する。
論文 参考訳(メタデータ) (2021-02-11T18:59:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。