論文の概要: Self-Concordant Analysis of Generalized Linear Bandits with Forgetting
- arxiv url: http://arxiv.org/abs/2011.00819v2
- Date: Thu, 4 Mar 2021 09:37:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 10:46:22.407066
- Title: Self-Concordant Analysis of Generalized Linear Bandits with Forgetting
- Title(参考訳): 投射による一般線形帯域の自己一致解析
- Authors: Yoan Russac (DI-ENS, CNRS, PSL, VALDA), Louis Faury, Olivier Capp\'e
(DI-ENS, VALDA), Aur\'elien Garivier (UMPA-ENSL)
- Abstract要約: ポアソンウィンドウや指数重みを用いた自己調和型GLB(ロジスティック回帰を含む)に焦点を当てる。
本稿では,GLB(Generalized Bandits)問題に対処するためのアプローチを提案する。
- 参考スコア(独自算出の注目度): 2.282313031205821
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Contextual sequential decision problems with categorical or numerical
observations are ubiquitous and Generalized Linear Bandits (GLB) offer a solid
theoretical framework to address them. In contrast to the case of linear
bandits, existing algorithms for GLB have two drawbacks undermining their
applicability. First, they rely on excessively pessimistic concentration bounds
due to the non-linear nature of the model. Second, they require either
non-convex projection steps or burn-in phases to enforce boundedness of the
estimators. Both of these issues are worsened when considering non-stationary
models, in which the GLB parameter may vary with time. In this work, we focus
on self-concordant GLB (which include logistic and Poisson regression) with
forgetting achieved either by the use of a sliding window or exponential
weights. We propose a novel confidence-based algorithm for the maximum-likehood
estimator with forgetting and analyze its perfomance in abruptly changing
environments. These results as well as the accompanying numerical simulations
highlight the potential of the proposed approach to address non-stationarity in
GLB.
- Abstract(参考訳): カテゴリー的あるいは数値的観察を伴う文脈的逐次決定問題はユビキタスであり、一般化線形バンド(glb)はそれらに対処するための固い理論的枠組みを提供する。
線形帯域の場合とは対照的に、GLBの既存のアルゴリズムは適用性を損なう2つの欠点がある。
まず、モデルの非線形の性質のため、過度に悲観的な濃度境界に依存する。
第二に、推定器の有界性を強制するためには、非凸射影ステップかバーンインフェーズのいずれかが必要である。
これらの問題は、GLBパラメータが時間によって変化する可能性のある非定常モデルを考えると、どちらも悪化する。
本研究では,スライディングウインドウと指数重みのどちらかを用いて達成した自己調和型GLB(ロジスティックおよびポアソン回帰を含む)に着目した。
そこで本研究では,急速変化する環境において,最大類似推定器に対する信頼度に基づく新しいアルゴリズムを提案する。
これらの結果とそれに伴う数値シミュレーションは,GLBの非定常性に対処する提案手法の可能性を強調している。
関連論文リスト
- Constrained Sampling with Primal-Dual Langevin Monte Carlo [15.634831573546041]
この研究は、正規化定数まで既知の確率分布からサンプリングする問題を考察する。
一般非線形関数の期待値によって定義された統計的制約の集合を満たす。
我々は,目標分布とサンプルを同時に制約する離散時間原始二元Langevin Monte Carloアルゴリズム(PD-LMC)を提唱した。
論文 参考訳(メタデータ) (2024-11-01T13:26:13Z) - Likelihood Ratio Confidence Sets for Sequential Decision Making [51.66638486226482]
確率に基づく推論の原理を再検討し、確率比を用いて妥当な信頼シーケンスを構築することを提案する。
本手法は, 精度の高い問題に特に適している。
提案手法は,オンライン凸最適化への接続に光を当てることにより,推定器の最適シーケンスを確実に選択する方法を示す。
論文 参考訳(メタデータ) (2023-11-08T00:10:21Z) - Stable Nonconvex-Nonconcave Training via Linear Interpolation [51.668052890249726]
本稿では,ニューラルネットワークトレーニングを安定化(大規模)するための原理的手法として,線形アヘッドの理論解析を提案する。
最適化過程の不安定性は、しばしば損失ランドスケープの非単調性によって引き起こされるものであり、非拡張作用素の理論を活用することによって線型性がいかに役立つかを示す。
論文 参考訳(メタデータ) (2023-10-20T12:45:12Z) - Optimal variance-reduced stochastic approximation in Banach spaces [114.8734960258221]
可分バナッハ空間上で定義された収縮作用素の定点を推定する問題について検討する。
演算子欠陥と推定誤差の両方に対して漸近的でない境界を確立する。
論文 参考訳(メタデータ) (2022-01-21T02:46:57Z) - BCD Nets: Scalable Variational Approaches for Bayesian Causal Discovery [97.79015388276483]
構造方程式モデル(SEM)は、有向非巡回グラフ(DAG)を介して表される因果関係を推論する効果的な枠組みである。
近年の進歩により、観測データからDAGの有効最大点推定が可能となった。
線形ガウス SEM を特徴付ける DAG 上の分布を推定するための変分フレームワークである BCD Nets を提案する。
論文 参考訳(メタデータ) (2021-12-06T03:35:21Z) - Learning to Estimate Without Bias [57.82628598276623]
ガウスの定理は、重み付き最小二乗推定器は線形モデルにおける線形最小分散アンバイアスド推定(MVUE)であると述べている。
本稿では、バイアス制約のあるディープラーニングを用いて、この結果を非線形設定に拡張する第一歩を踏み出す。
BCEの第二の動機は、同じ未知の複数の推定値が平均化されてパフォーマンスが向上するアプリケーションにおいてである。
論文 参考訳(メタデータ) (2021-10-24T10:23:51Z) - Interior Point Solving for LP-based prediction+optimisation [14.028706088791473]
線形プログラミングのインテリア・ポイント・ソルバで広く使われているような、より原理化された対数障壁項の使用について検討する。
我々の手法は、Willerらの最先端QPTL(Quadratic Programming Task Los)とElmachtoubとGrigasのSPOアプローチよりも優れている。
論文 参考訳(メタデータ) (2020-10-26T23:05:21Z) - Consistent Second-Order Conic Integer Programming for Learning Bayesian
Networks [2.7473982588529653]
連続観測データからBNのスパースDAG構造を学習する問題について検討する。
この数学的プログラムの最適解は、ある条件下では望ましい統計的性質を持つことが知られている。
ほぼ最適解を得るために, 分岐・結合プロセスの終了に向け, 早期停止条件を提案する。
論文 参考訳(メタデータ) (2020-05-29T00:13:15Z) - On the Convergence Rate of Projected Gradient Descent for a
Back-Projection based Objective [58.33065918353532]
我々は、最小二乗(LS)の代替として、バックプロジェクションに基づく忠実度項を考える。
LS項ではなくBP項を用いることで最適化アルゴリズムの繰り返しを少なくすることを示す。
論文 参考訳(メタデータ) (2020-05-03T00:58:23Z) - Algorithms for Non-Stationary Generalized Linear Bandits [0.0]
ロジスティック回帰は、標準線形モデリングの使用よりも好ましいことが知られている。
スライドウインドウと最大形状推定器のどちらかを利用する2つの高信頼境界ベースアルゴリズムを提案する。
一般的な文脈系列に対するこれらのアルゴリズムの挙動と急激な変化の存在に関する理論的保証を提供する。
論文 参考訳(メタデータ) (2020-03-23T07:44:59Z) - On Low-rank Trace Regression under General Sampling Distribution [9.699586426043885]
クロスバリデード推定器は一般仮定でほぼ最適誤差境界を満たすことを示す。
また, クロスバリデーション推定器はパラメータ選択理論に着想を得た手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2019-04-18T02:56:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。