論文の概要: Statistical Inference for Online Decision Making via Stochastic Gradient
Descent
- arxiv url: http://arxiv.org/abs/2010.07341v1
- Date: Wed, 14 Oct 2020 18:25:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 12:43:01.979921
- Title: Statistical Inference for Online Decision Making via Stochastic Gradient
Descent
- Title(参考訳): 確率勾配によるオンライン意思決定の統計的推測
- Authors: Haoyu Chen, Wenbin Lu, Rui Song
- Abstract要約: 我々は、決定を下し、決定ルールをオンラインで更新するオンラインアルゴリズムを提案する。
効率的だけでなく、あらゆる種類のパラメトリック報酬モデルもサポートしている。
提案アルゴリズムと理論的結果は,ニュース記事レコメンデーションへのシミュレーションおよび実データ応用によって検証される。
- 参考スコア(独自算出の注目度): 31.103438051597887
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online decision making aims to learn the optimal decision rule by making
personalized decisions and updating the decision rule recursively. It has
become easier than before with the help of big data, but new challenges also
come along. Since the decision rule should be updated once per step, an offline
update which uses all the historical data is inefficient in computation and
storage. To this end, we propose a completely online algorithm that can make
decisions and update the decision rule online via stochastic gradient descent.
It is not only efficient but also supports all kinds of parametric reward
models. Focusing on the statistical inference of online decision making, we
establish the asymptotic normality of the parameter estimator produced by our
algorithm and the online inverse probability weighted value estimator we used
to estimate the optimal value. Online plugin estimators for the variance of the
parameter and value estimators are also provided and shown to be consistent, so
that interval estimation and hypothesis test are possible using our method. The
proposed algorithm and theoretical results are tested by simulations and a real
data application to news article recommendation.
- Abstract(参考訳): オンライン意思決定は、パーソナライズされた意思決定を行い、再帰的に決定ルールを更新することによって、最適な決定ルールを学ぶことを目的としている。
ビッグデータの助けを借りて、これまで以上に簡単になりましたが、新しい課題も生まれました。
決定ルールはステップ毎に1回更新する必要があるため、すべての履歴データを使用するオフライン更新は、計算とストレージにおいて非効率である。
そこで本研究では,確率的勾配降下によって決定ルールをオンラインに更新できる完全オンラインアルゴリズムを提案する。
効率的だけでなく、あらゆる種類のパラメトリック報酬モデルもサポートしている。
オンライン意思決定の統計的推測に着目し,アルゴリズムが生成したパラメータ推定器の漸近正規度と,最適値の推定に用いたオンライン逆確率重み値推定器を確立する。
パラメータと値の分散に対するオンラインプラグイン推定器も提供され、一貫性があることが示され、この方法で間隔推定と仮説テストが可能である。
提案アルゴリズムと理論的結果は,ニュース記事推薦へのシミュレーションおよび実データ応用によって検証される。
関連論文リスト
- Optimal Baseline Corrections for Off-Policy Contextual Bandits [61.740094604552475]
オンライン報酬指標の偏りのないオフライン推定を最適化する意思決定ポリシーを学習することを目指している。
学習シナリオにおける同値性に基づく単一のフレームワークを提案する。
我々のフレームワークは、分散最適非バイアス推定器の特徴付けを可能にし、それに対する閉形式解を提供する。
論文 参考訳(メタデータ) (2024-05-09T12:52:22Z) - Online Estimation via Offline Estimation: An Information-Theoretic Framework [75.80823630681323]
オフライン推定アルゴリズムをオンライン推定アルゴリズムに変換することは可能か?
我々はOracle-Efficient Online Estimation (OEOE)という新しいフレームワークを導入し,学習者はストリーム上で動作しているブラックボックスアルゴリズムによって生成されたオフライン推定器のシーケンスを通じて,データストリームと間接的にのみ対話することができる。
論文 参考訳(メタデータ) (2024-04-15T20:19:18Z) - Online Tensor Inference [0.0]
従来のオフライン学習は、各計算繰り返しにおける全てのデータの保存と利用を伴い、高次元テンソルデータには実用的ではない。
既存の低ランクテンソル法は、オンラインの方法での統計的推論能力に欠ける。
本手法では,広範囲なメモリ要求を伴わずに効率的なリアルタイムデータ処理を実現するため,グラディエント・Descent (SGD) を用いる。
論文 参考訳(メタデータ) (2023-12-28T16:37:48Z) - Likelihood Ratio Confidence Sets for Sequential Decision Making [51.66638486226482]
確率に基づく推論の原理を再検討し、確率比を用いて妥当な信頼シーケンスを構築することを提案する。
本手法は, 精度の高い問題に特に適している。
提案手法は,オンライン凸最適化への接続に光を当てることにより,推定器の最適シーケンスを確実に選択する方法を示す。
論文 参考訳(メタデータ) (2023-11-08T00:10:21Z) - Low-rank extended Kalman filtering for online learning of neural
networks from streaming data [71.97861600347959]
非定常データストリームから非線形関数のパラメータを推定するための効率的なオンライン近似ベイズ推定アルゴリズムを提案する。
この方法は拡張カルマンフィルタ (EKF) に基づいているが、新しい低ランク+斜角行列分解法を用いている。
変分推論に基づく手法とは対照的に,本手法は完全に決定論的であり,ステップサイズチューニングを必要としない。
論文 参考訳(メタデータ) (2023-05-31T03:48:49Z) - Online Statistical Inference for Contextual Bandits via Stochastic
Gradient Descent [10.108468796986074]
意思決定の文脈的包括的枠組みにおけるモデルパラメータのオンライン統計的推測について検討する。
本稿では,重み付き勾配勾配による決定規則の更新が可能な,オンラインおよび適応型データ収集環境のための汎用フレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-30T18:57:08Z) - Sparse high-dimensional linear regression with a partitioned empirical
Bayes ECM algorithm [62.997667081978825]
疎高次元線形回帰に対する計算効率が高く強力なベイズ的手法を提案する。
パラメータに関する最小の事前仮定は、プラグイン経験的ベイズ推定(英語版)を用いて用いられる。
提案手法はRパッケージプローブに実装されている。
論文 参考訳(メタデータ) (2022-09-16T19:15:50Z) - Near-optimal inference in adaptive linear regression [60.08422051718195]
最小二乗法のような単純な方法でさえ、データが適応的に収集されるときの非正規な振る舞いを示すことができる。
我々は,これらの分布異常を少なくとも2乗推定で補正するオンラインデバイアス推定器のファミリーを提案する。
我々は,マルチアームバンディット,自己回帰時系列推定,探索による能動的学習などの応用を通して,我々の理論の有用性を実証する。
論文 参考訳(メタデータ) (2021-07-05T21:05:11Z) - Fast and Robust Online Inference with Stochastic Gradient Descent via
Random Scaling [0.9806910643086042]
本稿では,勾配降下アルゴリズムの平均化法により推定されるパラメータのベクトルに対するオンライン推論法を提案する。
我々のアプローチはオンラインデータで完全に運用されており、機能中心極限定理によって厳格に支えられている。
論文 参考訳(メタデータ) (2021-06-06T15:38:37Z) - Online Covariance Matrix Estimation in Stochastic Gradient Descent [10.153224593032677]
勾配降下(SGD)は,特に大規模データセットやオンライン学習においてパラメータ推定に広く用いられている。
本稿では,オンライン環境でのSGDに基づく推定値の統計的推測を定量化することを目的とする。
論文 参考訳(メタデータ) (2020-02-10T17:46:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。