論文の概要: Blackwell's Approachability for Sequential Conformal Inference
- arxiv url: http://arxiv.org/abs/2510.15824v1
- Date: Fri, 17 Oct 2025 17:06:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-20 20:17:34.720608
- Title: Blackwell's Approachability for Sequential Conformal Inference
- Title(参考訳): 逐次等角推論におけるブラックウェルのアプローチ可能性
- Authors: Guillaume Principato, Gilles Stoltz,
- Abstract要約: 我々は、ブラックウェルのアプローチ可能性理論のレンズを通して、交換不能な環境における共形推論を研究する。
まず,適応型共形推論を2つのベクター値の繰り返し有限ゲームとして再キャストする。
次に、敵のプレーに対する潜在的な制限の下で、カバレッジと効率の目標を構築し、これらの目標を達成するためにキャリブレーションに基づくアプローチ可能性戦略を設計する。
- 参考スコア(独自算出の注目度): 4.375849701845208
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study conformal inference in non-exchangeable environments through the lens of Blackwell's theory of approachability. We first recast adaptive conformal inference (ACI, Gibbs and Cand\`es, 2021) as a repeated two-player vector-valued finite game and characterize attainable coverage--efficiency tradeoffs. We then construct coverage and efficiency objectives under potential restrictions on the adversary's play, and design a calibration-based approachability strategy to achieve these goals. The resulting algorithm enjoys strong theoretical guarantees and provides practical insights, though its computational burden may limit deployment in practice.
- Abstract(参考訳): 我々は、ブラックウェルのアプローチ可能性理論のレンズを通して、交換不能な環境における共形推論を研究する。
適応型共形推論(ACI, Gibbs, Cand\`es, 2021)をベクトル値の繰り返し有限ゲームとして再キャストし, 達成可能なカバレッジ効率のトレードオフを特徴付ける。
次に、敵のプレーに対する潜在的な制限の下で、カバレッジと効率の目標を構築し、これらの目標を達成するためにキャリブレーションに基づくアプローチ可能性戦略を設計する。
結果のアルゴリズムは強力な理論的保証を享受し、実際的な洞察を提供するが、計算上の負担は実際の展開を制限する可能性がある。
関連論文リスト
- Rectified Robust Policy Optimization for Model-Uncertain Constrained Reinforcement Learning without Strong Duality [53.525547349715595]
我々はRectified Robust Policy Optimization (RRPO) と呼ばれる新しいプライマリのみのアルゴリズムを提案する。
RRPOは双対の定式化に頼ることなく、主問題に直接作用する。
我々は、最もよく知られた下界と一致する複雑性を持つ、ほぼ最適な実現可能なポリシーに収束することを示す。
論文 参考訳(メタデータ) (2025-08-24T16:59:38Z) - Learning safe, constrained policies via imitation learning: Connection to Probabilistic Inference and a Naive Algorithm [0.22099217573031676]
本稿では,タスクを実行する専門家が示す制約に従って,最大エントロピーポリシーを学習するための模倣学習手法を紹介する。
実験により,制約を課す動作に対する効果的なポリシーモデルを,異なるタイプの制約が複数あり,一般化可能な設定で学習できることが示唆された。
論文 参考訳(メタデータ) (2025-07-09T12:11:27Z) - Binarization-Aware Adjuster: Bridging Continuous Optimization and Binary Inference in Edge Detection [0.0]
画像エッジ検出(ED)は、トレーニングと推論の根本的なミスマッチに直面します。
本稿では,バイナリ化アウェア (BAA) を設計するための理論的手法を提案する。
BAAは二項化の挙動を勾配に基づく最適化に明示的に組み入れている。
論文 参考訳(メタデータ) (2025-06-14T11:56:44Z) - Constrained Online Decision-Making: A Unified Framework [14.465944215100746]
本稿では,段階的実現可能性制約による逐次意思決定の一般的な定式化について検討する。
本稿では,既存の制約付き学習問題を抽出する統一的なアルゴリズムフレームワークを提案する。
この結果は、理論と実践の両方において、制約付きシーケンシャルな意思決定のための原則化された基盤を提供する。
論文 参考訳(メタデータ) (2025-05-11T19:22:04Z) - Adversarial Constrained Policy Optimization: Improving Constrained Reinforcement Learning by Adapting Budgets [6.5472155063246085]
制約付き強化学習は、報酬と制約の両方が考慮される安全クリティカルな分野において、有望な進歩を遂げてきた。
本稿では,報酬の同時最適化とトレーニング中のコスト予算の適応を可能にする適応的制約付き政策最適化(ACPO)を提案する。
論文 参考訳(メタデータ) (2024-10-28T07:04:32Z) - Resilient Constrained Reinforcement Learning [87.4374430686956]
本稿では,複数の制約仕様を事前に特定しない制約付き強化学習(RL)のクラスについて検討する。
報酬訓練目標と制約満足度との間に不明確なトレードオフがあるため、適切な制約仕様を特定することは困難である。
我々は、ポリシーと制約仕様を一緒に検索する新しい制約付きRLアプローチを提案する。
論文 参考訳(メタデータ) (2023-12-28T18:28:23Z) - Constrained Bayesian Optimization with Adaptive Active Learning of
Unknown Constraints [10.705151736050967]
制約下での目的の最適化は、科学実験設計、医療療法の設計、産業プロセス最適化といった現実世界の応用において一般的なシナリオである。
一般のROIを決定するために,各側面から特定されたROIと交差する効率的なCBOフレームワークを提案する。
本稿では,実証的な証拠を通じて提案したCBOフレームワークの効率性とロバスト性を実証し,CBOアルゴリズムの実践的後悔境界を導出する根本的な課題について論じる。
論文 参考訳(メタデータ) (2023-10-12T22:32:00Z) - Probabilistic Reach-Avoid for Bayesian Neural Networks [71.67052234622781]
最適合成アルゴリズムは、証明された状態の数を4倍以上に増やすことができることを示す。
このアルゴリズムは、平均的な到達回避確率を3倍以上に向上させることができる。
論文 参考訳(メタデータ) (2023-10-03T10:52:21Z) - A Regularized Implicit Policy for Offline Reinforcement Learning [54.7427227775581]
オフラインの強化学習は、環境とのさらなるインタラクションなしに、固定データセットから学習を可能にする。
フレキシブルだが十分に調整された完全実装ポリシーの学習を支援するフレームワークを提案する。
D4RLデータセットの実験とアブレーション研究により、我々のフレームワークとアルゴリズム設計の有効性が検証された。
論文 参考訳(メタデータ) (2022-02-19T20:22:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。