論文の概要: Regenerative Particle Thompson Sampling
- arxiv url: http://arxiv.org/abs/2203.08082v2
- Date: Mon, 8 May 2023 17:27:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-10 01:14:36.627100
- Title: Regenerative Particle Thompson Sampling
- Title(参考訳): 再生粒子トンプソンサンプリング
- Authors: Zeyu Zhou, Bruce Hajek, Nakjung Choi, Anwar Walid
- Abstract要約: 再生型トンプソンサンプリング(RPTS)は、トンプソンサンプリングの柔軟なバリエーションである。
RPTSは、崩壊する不適合粒子を除去し、不適合粒子の近傍で新しい粒子を再生する。
- 参考スコア(独自算出の注目度): 5.408138442356806
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This paper proposes regenerative particle Thompson sampling (RPTS), a
flexible variation of Thompson sampling. Thompson sampling itself is a Bayesian
heuristic for solving stochastic bandit problems, but it is hard to implement
in practice due to the intractability of maintaining a continuous posterior
distribution. Particle Thompson sampling (PTS) is an approximation of Thompson
sampling obtained by simply replacing the continuous distribution by a discrete
distribution supported at a set of weighted static particles. We observe that
in PTS, the weights of all but a few fit particles converge to zero. RPTS is
based on the heuristic: delete the decaying unfit particles and regenerate new
particles in the vicinity of fit surviving particles. Empirical evidence shows
uniform improvement from PTS to RPTS and flexibility and efficacy of RPTS
across a set of representative bandit problems, including an application to 5G
network slicing.
- Abstract(参考訳): 本稿では, 再生粒子トンプソンサンプリング (RPTS) を提案する。
トンプソンサンプリングそのものは確率的バンディット問題を解決するベイズ的ヒューリスティックであるが、連続した後続分布を維持するという難しさのために実際に実装することは困難である。
粒子トンプソンサンプリング(英: particle thompson sampling、pts)は、連続分布を重み付き静粒子の集合で支持される離散分布に置き換えることで得られるトンプソンサンプリングの近似である。
PTSでは、いくつかの適合粒子を除く全ての重みが0に収束する。
RPTSは、崩壊する不適合粒子を除去し、不適合粒子の近傍で新しい粒子を再生する、というヒューリスティックに基づいている。
実証的な証拠は、RPTSからRPTSへの均一な改善と、5Gネットワークスライシングへの応用を含む一連の代表的な帯域幅問題に対するRPTSの柔軟性と有効性を示している。
関連論文リスト
- Persistent Sampling: Unleashing the Potential of Sequential Monte Carlo [0.0]
逐次モンテカルロ法の拡張であるパーシステンスサンプリング(PS)を導入する。
PSは、繰り返しに分散する粒子の増大し重み付けされたアンサンブルを生成する。
PSは標準手法を一貫して上回り、後部モーメント推定において低い2乗バイアスを達成する。
論文 参考訳(メタデータ) (2024-07-30T10:34:40Z) - Iterated Denoising Energy Matching for Sampling from Boltzmann Densities [109.23137009609519]
反復Denoising Energy Matching (iDEM)
iDEMは,拡散型サンプリング装置から高モデル密度のサンプリング領域を (I) 交換し, (II) それらのサンプルをマッチング目的に使用した。
提案手法は,全測定値の最先端性能を達成し,2~5倍の速さでトレーニングを行う。
論文 参考訳(メタデータ) (2024-02-09T01:11:23Z) - VITS : Variational Inference Thompson Sampling for contextual bandits [10.028119153832346]
我々は、文脈的帯域幅に対するトンプソンサンプリング(TS)アルゴリズムの変種を導入・解析する。
ガウス変分推論に基づく新しいアルゴリズムであるValational Inference Thompson sample VITSを提案する。
我々は,VITS が線形文脈帯域に対して従来の TS の次元とラウンド数で同じ順序のサブ線形後悔境界を達成することを示す。
論文 参考訳(メタデータ) (2023-07-19T17:53:22Z) - Langevin Monte Carlo for Contextual Bandits [72.00524614312002]
Langevin Monte Carlo Thompson Sampling (LMC-TS) が提案されている。
提案アルゴリズムは,文脈的帯域幅の特別な場合において,最高のトンプソンサンプリングアルゴリズムと同じサブ線形残差を達成できることを示す。
論文 参考訳(メタデータ) (2022-06-22T17:58:23Z) - Finite-Time Regret of Thompson Sampling Algorithms for Exponential
Family Multi-Armed Bandits [88.21288104408556]
本研究では,指数関数族バンドイットに対するトンプソンサンプリング (TS) アルゴリズムの遺残について検討する。
最適な腕の過小評価を避けるために,新しいサンプリング分布を用いたトンプソンサンプリング(Expulli)を提案する。
論文 参考訳(メタデータ) (2022-06-07T18:08:21Z) - Unrolling Particles: Unsupervised Learning of Sampling Distributions [102.72972137287728]
粒子フィルタリングは複素系の優れた非線形推定を計算するために用いられる。
粒子フィルタは様々なシナリオにおいて良好な推定値が得られることを示す。
論文 参考訳(メタデータ) (2021-10-06T16:58:34Z) - Sampling-free Variational Inference for Neural Networks with
Multiplicative Activation Noise [51.080620762639434]
サンプリングフリー変動推論のための後方近似のより効率的なパラメータ化を提案する。
提案手法は,標準回帰問題に対する競合的な結果をもたらし,大規模画像分類タスクに適している。
論文 参考訳(メタデータ) (2021-03-15T16:16:18Z) - Asymptotic Convergence of Thompson Sampling [0.0]
トンプソンサンプリングは、様々なオンライン学習タスクにおいて効果的なポリシーであることが示されている。
我々は、準線形ベイズ的後悔を仮定して、トンプソンサンプリングの収束結果を証明した。
この結果はトンプソンサンプリングに固有のマーチンゲール構造に依存している。
論文 参考訳(メタデータ) (2020-11-08T07:36:49Z) - Analysis and Design of Thompson Sampling for Stochastic Partial
Monitoring [91.22679787578438]
部分モニタリングのためのトンプソンサンプリングに基づく新しいアルゴリズムを提案する。
局所可観測性を持つ問題の線形化変種に対して,新たなアルゴリズムが対数問題依存の擬似回帰$mathrmO(log T)$を達成することを証明した。
論文 参考訳(メタデータ) (2020-06-17T05:48:33Z) - Ensemble Sampling [18.85309520133554]
本稿では,ニューラルネットワークのような複雑なモデルに直面した場合でも,トラクタビリティを維持しつつ,トンプソンサンプリングを近似するアンサンブルサンプリングを開発する。
我々は、このアプローチを支持する理論的基盤を確立し、さらなる洞察を提供する計算結果を示す。
論文 参考訳(メタデータ) (2017-05-20T19:36:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。