論文の概要: Multiscale Non-stationary Stochastic Bandits
- arxiv url: http://arxiv.org/abs/2002.05289v1
- Date: Thu, 13 Feb 2020 00:24:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-01 09:43:21.492078
- Title: Multiscale Non-stationary Stochastic Bandits
- Title(参考訳): マルチスケール非定常確率帯域
- Authors: Qin Ding, Cho-Jui Hsieh, James Sharpnack
- Abstract要約: 本稿では,非定常線形帯域問題に対して,Multiscale-LinUCBと呼ばれる新しいマルチスケール変更点検出法を提案する。
実験結果から,提案手法は非定常環境下での他の最先端アルゴリズムよりも優れていた。
- 参考スコア(独自算出の注目度): 83.48992319018147
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Classic contextual bandit algorithms for linear models, such as LinUCB,
assume that the reward distribution for an arm is modeled by a stationary
linear regression. When the linear regression model is non-stationary over
time, the regret of LinUCB can scale linearly with time. In this paper, we
propose a novel multiscale changepoint detection method for the non-stationary
linear bandit problems, called Multiscale-LinUCB, which actively adapts to the
changing environment. We also provide theoretical analysis of regret bound for
Multiscale-LinUCB algorithm. Experimental results show that our proposed
Multiscale-LinUCB algorithm outperforms other state-of-the-art algorithms in
non-stationary contextual environments.
- Abstract(参考訳): LinUCBのような線形モデルの古典的文脈帯域アルゴリズムは、アームの報酬分布は定常線形回帰によってモデル化されると仮定する。
線形回帰モデルが非定常である場合、linucbの後悔は時間とともに線形にスケールすることができる。
本稿では,変化環境に積極的に適応するマルチスケールlinucbと呼ばれる非定常線形バンディット問題のマルチスケール変化点検出手法を提案する。
また,Multiscale-LinUCBアルゴリズムに対する後悔境界の理論解析を行った。
実験結果から,提案手法は非定常環境における他の最先端アルゴリズムよりも優れていた。
関連論文リスト
- Indexed Minimum Empirical Divergence-Based Algorithms for Linear Bandits [55.938644481736446]
Indexed Minimum Empirical Divergence (IMED)は、マルチアームバンディット問題に対する非常に効果的なアプローチである。
UCBベースのアルゴリズムとトンプソンサンプリングを実証的に上回ることが観察されている。
我々は、LinIMEDアルゴリズムのファミリーと呼ぶIMEDアルゴリズムの新しい線形バージョンを提案する。
論文 参考訳(メタデータ) (2024-05-24T04:11:58Z) - An L-BFGS-B approach for linear and nonlinear system identification under $\ell_1$- and group-Lasso regularization [0.0]
線形および非線形離散時間状態空間モデルを同定するための非常に効率的な数値計算法を提案する。
提案手法のPython実装は、jax-sysidパッケージで利用可能である。
論文 参考訳(メタデータ) (2024-03-06T16:17:34Z) - Efficient Interpretable Nonlinear Modeling for Multiple Time Series [5.448070998907116]
本稿では,複数時系列に対する効率的な非線形モデリング手法を提案する。
異なる時系列変数間の非線形相互作用を含む。
実験結果から,提案アルゴリズムは相似的にVAR係数の支持値の同定を改善することが示された。
論文 参考訳(メタデータ) (2023-09-29T11:42:59Z) - Low-rank extended Kalman filtering for online learning of neural
networks from streaming data [71.97861600347959]
非定常データストリームから非線形関数のパラメータを推定するための効率的なオンライン近似ベイズ推定アルゴリズムを提案する。
この方法は拡張カルマンフィルタ (EKF) に基づいているが、新しい低ランク+斜角行列分解法を用いている。
変分推論に基づく手法とは対照的に,本手法は完全に決定論的であり,ステップサイズチューニングを必要としない。
論文 参考訳(メタデータ) (2023-05-31T03:48:49Z) - High-Dimensional Sparse Bayesian Learning without Covariance Matrices [66.60078365202867]
共分散行列の明示的な構成を避ける新しい推論手法を提案する。
本手法では, 数値線形代数と共役勾配アルゴリズムの対角線推定結果とを結合する。
いくつかのシミュレーションにおいて,本手法は計算時間とメモリにおける既存手法よりも拡張性が高い。
論文 参考訳(メタデータ) (2022-02-25T16:35:26Z) - Cogradient Descent for Dependable Learning [64.02052988844301]
双線形最適化問題に対処するために,CoGDアルゴリズムに基づく信頼度の高い学習法を提案する。
CoGDは、ある変数がスパーシティ制約を持つ場合の双線形問題を解くために導入された。
また、特徴と重みの関連を分解するためにも使用できるため、畳み込みニューラルネットワーク(CNN)をより良く訓練するための我々の手法をさらに一般化することができる。
論文 参考訳(メタデータ) (2021-06-20T04:28:20Z) - Covariance-Free Sparse Bayesian Learning [62.24008859844098]
共分散行列の明示的な反転を回避する新しいSBL推論アルゴリズムを導入する。
私たちの手法は、既存のベースラインよりも数千倍も高速です。
我々は,SBLが高次元信号回復問題に難なく対処できる新しいアルゴリズムについて紹介する。
論文 参考訳(メタデータ) (2021-05-21T16:20:07Z) - A polynomial-time algorithm for learning nonparametric causal graphs [18.739085486953698]
この分析はモデルフリーであり、線形性、付加性、独立ノイズ、忠実さを前提としない。
我々は、同値な分散を持つ線形模型の以前の研究と密接に関連する残差に条件を課す。
論文 参考訳(メタデータ) (2020-06-22T02:21:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。