論文の概要: Stochastic Low-rank Tensor Bandits for Multi-dimensional Online Decision
Making
- arxiv url: http://arxiv.org/abs/2007.15788v3
- Date: Tue, 13 Feb 2024 11:04:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-14 20:30:35.272378
- Title: Stochastic Low-rank Tensor Bandits for Multi-dimensional Online Decision
Making
- Title(参考訳): 多次元オンライン意思決定のための確率的低ランクテンソルバンド
- Authors: Jie Zhou, Botao Hao, Zheng Wen, Jingfei Zhang, Will Wei Sun
- Abstract要約: 低ランクテンソル・バンドイット(low-rank tensor bandits)は、平均報酬を低ランクテンソルとして表現できるバンドイットのクラスである。
文脈のないテンソルバンディットに対する2つの学習アルゴリズムを提案し、それらに対する有限時間後悔境界を導出する。
我々のアルゴリズムはテンソルの低ランク構造を無視する様々な最先端の手法より優れている。
- 参考スコア(独自算出の注目度): 39.77850139175452
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-dimensional online decision making plays a crucial role in many real
applications such as online recommendation and digital marketing. In these
problems, a decision at each time is a combination of choices from different
types of entities. To solve it, we introduce stochastic low-rank tensor
bandits, a class of bandits whose mean rewards can be represented as a low-rank
tensor. We consider two settings, tensor bandits without context and tensor
bandits with context. In the first setting, the platform aims to find the
optimal decision with the highest expected reward, a.k.a, the largest entry of
true reward tensor. In the second setting, some modes of the tensor are
contexts and the rest modes are decisions, and the goal is to find the optimal
decision given the contextual information. We propose two learning algorithms
tensor elimination and tensor epoch-greedy for tensor bandits without context,
and derive finite-time regret bounds for them. Comparing with existing
competitive methods, tensor elimination has the best overall regret bound and
tensor epoch-greedy has a sharper dependency on dimensions of the reward
tensor. Furthermore, we develop a practically effective Bayesian algorithm
called tensor ensemble sampling for tensor bandits with context. Extensive
simulations and real analysis in online advertising data back up our
theoretical findings and show that our algorithms outperform various
state-of-the-art approaches that ignore the tensor low-rank structure.
- Abstract(参考訳): 多次元オンライン意思決定は、オンラインレコメンデーションやデジタルマーケティングなど、多くの実アプリケーションにおいて重要な役割を果たす。
これらの問題において、各時点の決定は、異なる種類のエンティティからの選択の組み合わせである。
そこで我々は,低ランクテンソルとして平均報酬を表現できる帯域幅のクラスである確率的低ランクテンソルバンドビットを導入する。
コンテキストのないテンソルバンディットとコンテキストを持つテンソルバンディットの2つの設定を考える。
最初の設定では、プラットフォームは最も期待される報酬、すなわち真の報酬テンソルの最大のエントリーで最適な決定を見つけることを目的としている。
第二の設定では、テンソルのいくつかのモードは文脈であり、残りモードは決定であり、ゴールは文脈情報から最適な決定を見つけることである。
本研究では,コンテキストのないテンソルバンディットに対して,2つの学習アルゴリズムのテンソル除去とテンソルepoch-greedyを提案する。
既存の競争法と比較すると、テンソルの除去は全体的後悔の最良の境界を持ち、テンソルのエポックグリーディは報酬テンソルの次元へのよりシャープな依存を持つ。
さらに,コンテキスト付きテンソルバンディットに対するテンソルアンサンブルサンプリングと呼ばれる事実上有効ベイズアルゴリズムを開発した。
オンライン広告データの大規模なシミュレーションと実解析は、我々の理論的な結果を裏付け、我々のアルゴリズムがテンソルの低ランク構造を無視した様々な最先端のアプローチより優れていることを示す。
関連論文リスト
- Neural Dueling Bandits [58.90189511247936]
ニューラルネットワークを用いて、予め選択した腕の好みフィードバックを用いて報酬関数を推定する。
次に、理論結果を二項フィードバックによる文脈的帯域幅問題に拡張し、それはそれ自体は自明な寄与ではない。
論文 参考訳(メタデータ) (2024-07-24T09:23:22Z) - Multi-Dictionary Tensor Decomposition [5.733331864416094]
MDTD(Multi-Dictionary Decomposition)のためのフレームワークを提案する。
我々は、完全な入力と入力の両方を欠落した値で処理する、MDTDの一般的な最適化アルゴリズムを導出する。
何十億ものテンソルの欠落した値を、最先端の競合相手よりも正確かつ精巧に説明することができる。
論文 参考訳(メタデータ) (2023-09-18T12:31:56Z) - On High-dimensional and Low-rank Tensor Bandits [53.0829344775769]
この研究は一般的なテンソルバンドイットモデルについて研究し、アクションとシステムパラメータはベクトルとは対照的にテンソルで表される。
TOFU(Tensor Optimism in the Face of Uncertainity)と呼ばれる新しいバンディットアルゴリズムを開発した。
理論的解析により、TOFUは系の順序で指数関数的に増加する乗法的因子により、最もよく知られた後悔の上界を改善することが示されている。
論文 参考訳(メタデータ) (2023-05-06T00:43:36Z) - Low-Rank Tensor Function Representation for Multi-Dimensional Data
Recovery [52.21846313876592]
低ランクテンソル関数表現(LRTFR)は、無限解像度でメッシュグリッドを超えてデータを連続的に表現することができる。
テンソル関数に対する2つの基本的な概念、すなわちテンソル関数ランクとローランクテンソル関数分解を開発する。
提案手法は,最先端手法と比較して,提案手法の優越性と汎用性を裏付けるものである。
論文 参考訳(メタデータ) (2022-12-01T04:00:38Z) - Near-Linear Time and Fixed-Parameter Tractable Algorithms for Tensor
Decompositions [51.19236668224547]
テンソルの低階近似について検討し,テンソルトレインとタッカー分解に着目した。
テンソル列車の分解には、小さなビクリテリアランクを持つビクリテリア$(1 + eps)$-approximationアルゴリズムと、O(q cdot nnz(A))$ランニングタイムを与える。
さらに、任意のグラフを持つテンソルネットワークにアルゴリズムを拡張します。
論文 参考訳(メタデータ) (2022-07-15T11:55:09Z) - Efficient Tensor Completion via Element-wise Weighted Low-rank Tensor
Train with Overlapping Ket Augmentation [18.438177637687357]
本稿では,要素重み付け手法による新しいテンソル完備化手法を提案する。
具体的には,隣接ブロックからのエッジ要素の回復品質について検討する。
実験結果から,提案アルゴリズムのTWMac-TTは,他の競合するテンソル補完法よりも優れていることが示された。
論文 参考訳(メタデータ) (2021-09-13T06:50:37Z) - Robust M-estimation-based Tensor Ring Completion: a Half-quadratic
Minimization Approach [14.048989759890475]
我々はM推定器を誤差統計量として用いるテンソル環完備化への頑健なアプローチを開発する。
truncatedの特異値分解と行列分解に基づくHQに基づく2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-06-19T04:37:50Z) - Multi-version Tensor Completion for Time-delayed Spatio-temporal Data [50.762087239885936]
実世界の時間データは、様々なデータ読み込み遅延のために不完全または不正確な場合が多い。
経時的に更新を予測するための低ランクテンソルモデルを提案する。
最良基準法に比べて最大27.2%低いルート平均二乗誤差が得られる。
論文 参考訳(メタデータ) (2021-05-11T19:55:56Z) - Tensor Completion via Tensor Networks with a Tucker Wrapper [28.83358353043287]
本論文では,タッカーラッパーを用いたテンソルネットワークを用いて低ランクテンソル完備化(LRTC)を解くことを提案する。
次に、未知の要素を更新するために、2段階の最小二乗法を用いる。
数値シミュレーションにより,提案アルゴリズムは最先端手法に匹敵することを示す。
論文 参考訳(メタデータ) (2020-10-29T17:54:01Z) - Tensor completion via nonconvex tensor ring rank minimization with
guaranteed convergence [16.11872681638052]
近年の研究では、テンソル環(TR)のランクはテンソル完備化において高い効果を示している。
最近提案されたTRランクは、特異値が等しくペナル化される重み付き和の中で構造を捉えることに基づいている。
本稿では,ロゼット型関数を非スムーズな緩和法として利用することを提案する。
論文 参考訳(メタデータ) (2020-05-14T03:13:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。