論文の概要: Likelihood Ratio Confidence Sets for Sequential Decision Making
- arxiv url: http://arxiv.org/abs/2311.04402v1
- Date: Wed, 8 Nov 2023 00:10:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-09 17:45:19.837883
- Title: Likelihood Ratio Confidence Sets for Sequential Decision Making
- Title(参考訳): 逐次意思決定のための確率比信頼度セット
- Authors: Nicolas Emmenegger, Mojm\'ir Mutn\'y, Andreas Krause
- Abstract要約: 確率に基づく推論の原理を再検討し、確率比を用いて妥当な信頼シーケンスを構築することを提案する。
本手法は, 精度の高い問題に特に適している。
提案手法は,オンライン凸最適化への接続に光を当てることにより,推定器の最適シーケンスを確実に選択する方法を示す。
- 参考スコア(独自算出の注目度): 51.66638486226482
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Certifiable, adaptive uncertainty estimates for unknown quantities are an
essential ingredient of sequential decision-making algorithms. Standard
approaches rely on problem-dependent concentration results and are limited to a
specific combination of parameterization, noise family, and estimator. In this
paper, we revisit the likelihood-based inference principle and propose to use
likelihood ratios to construct any-time valid confidence sequences without
requiring specialized treatment in each application scenario. Our method is
especially suitable for problems with well-specified likelihoods, and the
resulting sets always maintain the prescribed coverage in a model-agnostic
manner. The size of the sets depends on a choice of estimator sequence in the
likelihood ratio. We discuss how to provably choose the best sequence of
estimators and shed light on connections to online convex optimization with
algorithms such as Follow-the-Regularized-Leader. To counteract the initially
large bias of the estimators, we propose a reweighting scheme that also opens
up deployment in non-parametric settings such as RKHS function classes. We
provide a non-asymptotic analysis of the likelihood ratio confidence sets size
for generalized linear models, using insights from convex duality and online
learning. We showcase the practical strength of our method on generalized
linear bandit problems, survival analysis, and bandits with various additive
noise distributions.
- Abstract(参考訳): 未知量の適応的不確実性推定は、逐次決定アルゴリズムの重要な要素である。
標準的なアプローチは問題依存の集中結果に依存しており、パラメータ化、ノイズファミリー、推定器の特定の組み合わせに限られている。
本稿では,確率に基づく推論の原理を再検討し,各アプリケーションシナリオにおいて特別な処理を必要とせずに,任意の時間有効信頼シーケンスを構築するための確率比を提案する。
本手法は, 精度の高い問題に対して特に適しており, 得られた集合は, 常に所定の範囲をモデルに依存しない方法で維持する。
集合のサイズは、確率比における推定子列の選択に依存する。
本稿では,オンライン凸最適化における最良推定器の選択方法と,フォロー・ザ・レギュラライズ・リーダなどのアルゴリズムとの関連について考察する。
推定器の初期の大きなバイアスに対処するために、RKHS関数クラスのようなパラメータでない設定での展開を開放する再重み付け方式を提案する。
本研究では,凸双対性とオンライン学習の知見を用いて,一般化線形モデルに対する確率比信頼度集合のサイズを非漸近的に解析する。
本稿では,様々な付加雑音分布を有する線形バンディット問題,サバイバル解析,バンディット法の実践的強度を示す。
関連論文リスト
- From Conformal Predictions to Confidence Regions [1.4272411349249627]
モデルパラメータに対する信頼領域を確立するために,モデル出力に共形予測間隔を組み合わせたCCRを導入する。
本稿では,雑音に対する最小限の仮定の下でのカバレッジ保証について述べる。
本手法は, 完全あるいはクロスコンフォーマルなアプローチを含む, 分割共形予測とブラックボックス手法の両方に適用可能である。
論文 参考訳(メタデータ) (2024-05-28T21:33:12Z) - Optimal Baseline Corrections for Off-Policy Contextual Bandits [61.740094604552475]
オンライン報酬指標の偏りのないオフライン推定を最適化する意思決定ポリシーを学習することを目指している。
学習シナリオにおける同値性に基づく単一のフレームワークを提案する。
我々のフレームワークは、分散最適非バイアス推定器の特徴付けを可能にし、それに対する閉形式解を提供する。
論文 参考訳(メタデータ) (2024-05-09T12:52:22Z) - Finite Sample Confidence Regions for Linear Regression Parameters Using
Arbitrary Predictors [1.6860963320038902]
線形モデルのパラメータに対する信頼領域を構築するための新しい手法を任意の予測器からの予測を用いて検討する。
導出された信頼領域は、混合線形プログラミングフレームワーク内の制約としてキャストすることができ、線形目的の最適化を可能にする。
従来の手法とは異なり、信頼領域は空であり、仮説テストに使用できる。
論文 参考訳(メタデータ) (2024-01-27T00:15:48Z) - Model-Based Epistemic Variance of Values for Risk-Aware Policy Optimization [59.758009422067]
モデルベース強化学習における累積報酬に対する不確実性を定量化する問題を考察する。
我々は、解が値の真後分散に収束する新しい不確実性ベルマン方程式(UBE)を提案する。
本稿では,リスク・サーキングとリスク・アバース・ポリシー最適化のいずれにも適用可能な汎用ポリシー最適化アルゴリズムQ-Uncertainty Soft Actor-Critic (QU-SAC)を導入する。
論文 参考訳(メタデータ) (2023-12-07T15:55:58Z) - Calibrating Neural Simulation-Based Inference with Differentiable
Coverage Probability [50.44439018155837]
ニューラルモデルのトレーニング目的に直接キャリブレーション項を含めることを提案する。
古典的なキャリブレーション誤差の定式化を緩和することにより、エンドツーエンドのバックプロパゲーションを可能にする。
既存の計算パイプラインに直接適用でき、信頼性の高いブラックボックス後部推論が可能である。
論文 参考訳(メタデータ) (2023-10-20T10:20:45Z) - Margin theory for the scenario-based approach to robust optimization in
high dimension [0.0]
本稿では、ロバストな最適化のためのシナリオアプローチを扱う。
これは、問題の不確実性によって引き起こされる可能性のある無限個の制約のランダムサンプリングに依存する。
論文 参考訳(メタデータ) (2023-03-07T13:33:46Z) - Integrated Conditional Estimation-Optimization [6.037383467521294]
確率のある不確実なパラメータを文脈的特徴情報を用いて推定できる実世界の多くの最適化問題である。
不確実なパラメータの分布を推定する標準的な手法とは対照的に,統合された条件推定手法を提案する。
当社のI CEOアプローチは、穏健な条件下で理論的に一貫性があることを示します。
論文 参考訳(メタデータ) (2021-10-24T04:49:35Z) - High Probability Complexity Bounds for Non-Smooth Stochastic Optimization with Heavy-Tailed Noise [51.31435087414348]
アルゴリズムが高い確率で小さな客観的残差を与えることを理論的に保証することが不可欠である。
非滑らか凸最適化の既存の方法は、信頼度に依存した複雑性境界を持つ。
そこで我々は,勾配クリッピングを伴う2つの手法に対して,新たなステップサイズルールを提案する。
論文 参考訳(メタデータ) (2021-06-10T17:54:21Z) - Amortized Conditional Normalized Maximum Likelihood: Reliable Out of
Distribution Uncertainty Estimation [99.92568326314667]
本研究では,不確実性推定のための拡張性のある汎用的アプローチとして,償却条件正規化最大値(ACNML)法を提案する。
提案アルゴリズムは条件付き正規化最大度(CNML)符号化方式に基づいており、最小記述長の原理に従って最小値の最適特性を持つ。
我々は、ACNMLが、分布外入力のキャリブレーションの観点から、不確実性推定のための多くの手法と好意的に比較することを示した。
論文 参考訳(メタデータ) (2020-11-05T08:04:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。