論文の概要: The Relationship between No-Regret Learning and Online Conformal Prediction
- arxiv url: http://arxiv.org/abs/2502.10947v1
- Date: Sun, 16 Feb 2025 01:39:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-18 14:14:12.002520
- Title: The Relationship between No-Regret Learning and Online Conformal Prediction
- Title(参考訳): 非線形学習とオンラインコンフォーマル予測の関係
- Authors: Ramya Ramalingam, Shayan Kiyani, Aaron Roth,
- Abstract要約: 本研究は,ノンレグレット学習とオンライン共形予測の関係を示す。
敵の設定における閾値カバレッジとスワップレグレットの密接な関係を示す。
また, グループ条件付きカバレッジを保証するために, 後悔しない学習アルゴリズムを使わずに, 続くリーダーファミリーのアルゴリズムを使用できることを示す。
- 参考スコア(独自算出の注目度): 6.953860546004666
- License:
- Abstract: Existing algorithms for online conformal prediction -- guaranteeing marginal coverage in adversarial settings -- are variants of online gradient descent (OGD), but their analyses of worst-case coverage do not follow from the regret guarantee of OGD. What is the relationship between no-regret learning and online conformal prediction? We observe that although standard regret guarantees imply marginal coverage in i.i.d. settings, this connection fails as soon as we either move to adversarial environments or ask for group conditional coverage. On the other hand, we show a tight connection between threshold calibrated coverage and swap-regret in adversarial settings, which extends to group-conditional (multi-valid) coverage. We also show that algorithms in the follow the perturbed leader family of no regret learning algorithms (which includes online gradient descent) can be used to give group-conditional coverage guarantees in adversarial settings for arbitrary grouping functions. Via this connection we analyze and conduct experiments using a multi-group generalization of the ACI algorithm of Gibbs & Candes [2021] (arXiv:2106.00170).
- Abstract(参考訳): 既存のオンライン整合予測アルゴリズム -- 敵の設定における限界カバレッジを保証する -- は、オンライン勾配降下(OGD)の変種である。
非学習学習とオンライン共形予測の関係はどのようなものか?
標準的な後悔は、設定において限界範囲のカバレッジを保証しますが、この接続は、敵の環境に移動したり、グループ条件のカバレッジを求めるとすぐに失敗します。
一方, 対側設定では, しきい値の校正範囲とスワップ・レグレットとの間に密接な関係がみられ, グループ条件(複数値)のカバレッジにまで拡張されている。
また, 学習アルゴリズム(オンライン勾配降下を含む)を含まない, 続くリーダーファミリーのアルゴリズムは, 任意のグループ化関数に対する対向的な設定において, グループ条件のカバレッジを保証するために使用できることを示した。
この接続を用いて、ギブス・アンド・カンデスのACIアルゴリズムを多群一般化した[2021] (arXiv:2106.00170) を用いて解析し、実験を行う。
関連論文リスト
- Conformal Prediction Sets with Improved Conditional Coverage using Trust Scores [52.92618442300405]
有限サンプルにおいて、正確に分布のない条件付きカバレッジを達成することは不可能である。
本稿では,最も重要となる範囲を対象とするコンフォメーション予測アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-01-17T12:01:56Z) - Adjusting Regression Models for Conditional Uncertainty Calibration [46.69079637538012]
本稿では,分割共形予測手法を適用して条件付きカバレッジを改善するために,回帰関数を訓練する新しいアルゴリズムを提案する。
本研究では,条件付きカバレッジと名目付きカバレッジ率の差分を求める上限を確立し,この上限値を制御するためのエンドツーエンドアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-09-26T01:55:45Z) - Adaptive Uncertainty Quantification for Generative AI [0.0]
分割コンフォーマルな推論を反映して、整合性のスコアを校正するブラックボックスアルゴリズムのラッパーを設計する。
校正セット上の適合点に頑健な回帰木を嵌合させることにより適応的分割を実現する。
従来のスプリット・コンフォーマルな推論とは異なり、適応的な分割とグループ内キャリブレーションは、局所的に拡張および縮小できる適応バンドをもたらす。
論文 参考訳(メタデータ) (2024-08-16T19:37:33Z) - Understanding the performance gap between online and offline alignment algorithms [63.137832242488926]
オフラインのアルゴリズムは、ペアの分類が得意になるようにポリシーを訓練し、オンラインのアルゴリズムは世代ごとに良いことを示しています。
このことは、識別能力と生成能力の間のユニークな相互作用を示唆しており、これはサンプリングプロセスに大きく影響している。
我々の研究は、AIアライメントにおけるオンラインサンプリングの重要な役割に光を当て、オフラインアライメントアルゴリズムのある種の根本的な課題を示唆している。
論文 参考訳(メタデータ) (2024-05-14T09:12:30Z) - Distributed Multi-Task Learning for Stochastic Bandits with Context Distribution and Stage-wise Constraints [0.0]
本稿では,分散上信頼度境界(UCB)アルゴリズム,関連UCBを提案する。
提案アルゴリズムは,各ラウンドにおいて,制約を満たすためにプルーニングされた動作セットを構築する。
合成データと実世界のMovielens-100Kデータに対するアルゴリズムの性能を実証的に検証した。
論文 参考訳(メタデータ) (2024-01-21T18:43:55Z) - Improved Online Conformal Prediction via Strongly Adaptive Online
Learning [86.4346936885507]
我々は、強い適応的後悔を最小限に抑える新しいオンライン共形予測手法を開発した。
提案手法は,すべての区間において,ほぼ最適に適応的な後悔を同時に達成できることを実証する。
実験により,本手法は実世界のタスクにおける既存の手法よりも,より優れたカバレッジと予測セットが得られることがわかった。
論文 参考訳(メタデータ) (2023-02-15T18:59:30Z) - Approximate Conditional Coverage via Neural Model Approximations [0.030458514384586396]
実験的に信頼性の高い近似条件付きカバレッジを得るためのデータ駆動手法を解析する。
我々は、限界範囲のカバレッジ保証を持つ分割型代替案で、実質的な(そして、そうでない)アンダーカバーの可能性を実証する。
論文 参考訳(メタデータ) (2022-05-28T02:59:05Z) - Optimal Clustering with Bandit Feedback [57.672609011609886]
本稿では,バンディットフィードバックを用いたオンラインクラスタリングの問題点について考察する。
これは、NPハード重み付きクラスタリング問題をサブルーチンとして解決する必要性を回避するための、シーケンシャルなテストのための新しい停止規則を含む。
合成および実世界のデータセットの広範なシミュレーションを通して、BOCの性能は下界と一致し、非適応的ベースラインアルゴリズムよりも大幅に優れることを示す。
論文 参考訳(メタデータ) (2022-02-09T06:05:05Z) - Post-Contextual-Bandit Inference [57.88785630755165]
コンテキストバンディットアルゴリズムは、電子商取引、医療、政策立案における非適応的なA/Bテストを置き換える傾向にある。
研究参加者の成果を改善することもでき、良い方針や最良の政策を特定できる可能性を高めることもできる。
研究の終盤における新規介入の信頼性推論を支援するため, 平均治療効果, サブグループ効果, あるいは新政策の価値について, 有効な信頼区間を構築したい。
論文 参考訳(メタデータ) (2021-06-01T12:01:51Z) - Online Learning in Contextual Bandits using Gated Linear Networks [27.784804411566405]
Gated Linear Contextual Bandits (GLCB) と呼ばれる新しいオンラインコンテクストブリストアルゴリズムを導入する。
GLCBはGated Linear Networks (GLNs)をベースにしている。
我々は、ディープニューラルネットワークを利用する9つの最先端アルゴリズムと比較して、GLCBを実証的に評価する。
論文 参考訳(メタデータ) (2020-02-21T11:50:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。