論文の概要: An Analysis of Ensemble Sampling
- arxiv url: http://arxiv.org/abs/2203.01303v1
- Date: Wed, 2 Mar 2022 18:41:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-03 14:23:46.860369
- Title: An Analysis of Ensemble Sampling
- Title(参考訳): アンサンブルサンプリングの解析
- Authors: Chao Qin, Zheng Wen, Xiuyuan Lu, Benjamin Van Roy
- Abstract要約: アンサンブルサンプリングは、モデルパラメータの正確な後部分布を維持する際に、トンプソンサンプリングの実用的な近似として機能する。
線形バンディット問題にアンサンブルサンプリングを適用する際に望ましい振る舞いを確実にするベイズ後悔境界を確立する。
- 参考スコア(独自算出の注目度): 28.18592417451813
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Ensemble sampling serves as a practical approximation to Thompson sampling
when maintaining an exact posterior distribution over model parameters is
computationally intractable. In this paper, we establish a Bayesian regret
bound that ensures desirable behavior when ensemble sampling is applied to the
linear bandit problem. This represents the first rigorous regret analysis of
ensemble sampling and is made possible by leveraging information-theoretic
concepts and novel analytic techniques that may prove useful beyond the scope
of this paper.
- Abstract(参考訳): アンサンブルサンプリングは、モデルパラメータの正確な後方分布を維持するとき、トンプソンサンプリングの実用的な近似となる。
本稿では,線形バンディット問題に対してアンサンブルサンプリングを適用する場合の望ましい行動を保証するベイズ後悔境界を確立する。
これは、アンサンブルサンプリングの厳密な後悔分析であり、この論文の範囲を超えて有用な情報理論の概念と新しい分析技術を活用することで可能となる。
関連論文リスト
- Unified Convergence Analysis for Score-Based Diffusion Models with Deterministic Samplers [49.1574468325115]
決定論的サンプリングのための統合収束分析フレームワークを提案する。
我々のフレームワークは$tilde O(d2/epsilon)$の反復複雑性を実現する。
また,Denoising Implicit Diffusion Models (DDIM) タイプのサンプルについて詳細な分析を行った。
論文 参考訳(メタデータ) (2024-10-18T07:37:36Z) - Using Stratified Sampling to Improve LIME Image Explanations [0.4416503115535552]
コンピュータビジョンタスクのためのモデルに依存しない説明可能なAI手法であるLIME Imageの階層化サンプリング手法について検討する。
このようなアーティファクトは、説明されている画像の周りの合成近傍における依存変数のアンダーサンプリングによるものである。
我々は,不偏成層化サンプリング推定器に必要な式と調整因子をすべて導出する。
論文 参考訳(メタデータ) (2024-03-26T14:30:23Z) - VITS : Variational Inference Thompson Sampling for contextual bandits [10.028119153832346]
我々は、文脈的帯域幅に対するトンプソンサンプリング(TS)アルゴリズムの変種を導入・解析する。
ガウス変分推論に基づく新しいアルゴリズムであるValational Inference Thompson sample VITSを提案する。
我々は,VITS が線形文脈帯域に対して従来の TS の次元とラウンド数で同じ順序のサブ線形後悔境界を達成することを示す。
論文 参考訳(メタデータ) (2023-07-19T17:53:22Z) - Outlier-robust Estimation of a Sparse Linear Model Using Invexity [31.061339148448006]
本稿では,外乱サンプルの存在下での正答率でスパース回帰ベクトルを推定する問題について検討する。
クリーンサンプルを同定する外乱ラッソのバージョンを提案する。
また,この問題に対する新しい凸緩和法を提供し,この緩和に関する理論的な保証を提供する。
論文 参考訳(メタデータ) (2023-06-22T05:48:25Z) - Restoration-Degradation Beyond Linear Diffusions: A Non-Asymptotic
Analysis For DDIM-Type Samplers [90.45898746733397]
本研究では拡散生成モデルに用いる決定論的サンプリング器の非漸近解析のためのフレームワークを開発する。
確率フローODEに沿った1ステップは,1) 条件付き対数線上を無限に先行して上昇する回復ステップ,2) 雑音を現在の勾配に向けて前向きに進行する劣化ステップの2段階で表すことができる。
論文 参考訳(メタデータ) (2023-03-06T18:59:19Z) - Revisiting the Sample Complexity of Sparse Spectrum Approximation of
Gaussian Processes [60.479499225746295]
本稿では,ガウス過程に対して,パラメータ空間全体に対して同時に保持可能な保証付きスケーラブルな近似を導入する。
我々の近似は、スパーススペクトルガウス過程(SSGP)のための改良されたサンプル複雑性解析から得られる。
論文 参考訳(メタデータ) (2020-11-17T05:41:50Z) - Analysis and Design of Thompson Sampling for Stochastic Partial
Monitoring [91.22679787578438]
部分モニタリングのためのトンプソンサンプリングに基づく新しいアルゴリズムを提案する。
局所可観測性を持つ問題の線形化変種に対して,新たなアルゴリズムが対数問題依存の擬似回帰$mathrmO(log T)$を達成することを証明した。
論文 参考訳(メタデータ) (2020-06-17T05:48:33Z) - Efficiently Sampling Functions from Gaussian Process Posteriors [76.94808614373609]
高速後部サンプリングのための簡易かつ汎用的なアプローチを提案する。
分離されたサンプルパスがガウス過程の後部を通常のコストのごく一部で正確に表現する方法を実証する。
論文 参考訳(メタデータ) (2020-02-21T14:03:16Z) - Ensemble Sampling [18.85309520133554]
本稿では,ニューラルネットワークのような複雑なモデルに直面した場合でも,トラクタビリティを維持しつつ,トンプソンサンプリングを近似するアンサンブルサンプリングを開発する。
我々は、このアプローチを支持する理論的基盤を確立し、さらなる洞察を提供する計算結果を示す。
論文 参考訳(メタデータ) (2017-05-20T19:36:36Z) - The Simulator: Understanding Adaptive Sampling in the
Moderate-Confidence Regime [52.38455827779212]
エミュレータと呼ばれる適応サンプリングを解析するための新しい手法を提案する。
適切なログファクタを組み込んだトップk問題の最初のインスタンスベースの下位境界を証明します。
我々の新しい分析は、後者の問題に対するこの種の最初のエミュレータであるベストアームとトップkの識別に、シンプルでほぼ最適であることを示した。
論文 参考訳(メタデータ) (2017-02-16T23:42:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。