論文の概要: On High-dimensional and Low-rank Tensor Bandits
- arxiv url: http://arxiv.org/abs/2305.03884v1
- Date: Sat, 6 May 2023 00:43:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-09 18:53:55.022012
- Title: On High-dimensional and Low-rank Tensor Bandits
- Title(参考訳): 高次元および低ランクテンソルバンディットについて
- Authors: Chengshuai Shi, Cong Shen, Nicholas D. Sidiropoulos
- Abstract要約: この研究は一般的なテンソルバンドイットモデルについて研究し、アクションとシステムパラメータはベクトルとは対照的にテンソルで表される。
TOFU(Tensor Optimism in the Face of Uncertainity)と呼ばれる新しいバンディットアルゴリズムを開発した。
理論的解析により、TOFUは系の順序で指数関数的に増加する乗法的因子により、最もよく知られた後悔の上界を改善することが示されている。
- 参考スコア(独自算出の注目度): 53.0829344775769
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most existing studies on linear bandits focus on the one-dimensional
characterization of the overall system. While being representative, this
formulation may fail to model applications with high-dimensional but favorable
structures, such as the low-rank tensor representation for recommender systems.
To address this limitation, this work studies a general tensor bandits model,
where actions and system parameters are represented by tensors as opposed to
vectors, and we particularly focus on the case that the unknown system tensor
is low-rank. A novel bandit algorithm, coined TOFU (Tensor Optimism in the Face
of Uncertainty), is developed. TOFU first leverages flexible tensor regression
techniques to estimate low-dimensional subspaces associated with the system
tensor. These estimates are then utilized to convert the original problem to a
new one with norm constraints on its system parameters. Lastly, a
norm-constrained bandit subroutine is adopted by TOFU, which utilizes these
constraints to avoid exploring the entire high-dimensional parameter space.
Theoretical analyses show that TOFU improves the best-known regret upper bound
by a multiplicative factor that grows exponentially in the system order. A
novel performance lower bound is also established, which further corroborates
the efficiency of TOFU.
- Abstract(参考訳): 線形帯域に関する既存の研究は、全体システムの一次元的特徴付けに重点を置いている。
代表的である間、この定式化は、レコメンダシステムに対する低ランクテンソル表現のような高次元だが好ましい構造を持つアプリケーションをモデル化できないかもしれない。
この制限に対処するため、本研究では、動作とシステムのパラメータがベクトルに対してテンソルとして表現される一般的なテンソルバンディットモデルの研究を行い、未知系のテンソルが低ランクである場合に特に注目する。
TOFU(Tensor Optimism in the Face of Uncertainity)と呼ばれる新しいバンディットアルゴリズムを開発した。
TOFUはまずフレキシブルテンソル回帰法を利用して、システムテンソルに関連する低次元部分空間を推定する。
これらの推定値は、元の問題をシステムパラメータに制約のある新しいものに変換するために使われる。
最後に、TOFUは、これらの制約を利用して高次元パラメータ空間全体を探索するのを避けるために、ノルム制約付きバンディットサブルーチンを採用する。
理論的解析により、TOFUは系の順序で指数関数的に増加する乗法的因子により、最もよく知られた後悔の上界を改善することが示された。
また、TOFUの効率をさらに裏付ける新たな性能下限も確立されている。
関連論文リスト
- Low-Rank Tensor Learning by Generalized Nonconvex Regularization [25.115066273660478]
低ランクテンソル学習の問題点について検討し, 基礎となるテンソルを観測するサンプルはごくわずかである。
非テンソル学習関数の族は、基礎となるテンソルの低ランク性を特徴づけるために用いられる。
結果の大量化最小化を解決するために設計されたアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-24T03:33:20Z) - Efficient Generalized Low-Rank Tensor Contextual Bandits [14.016197224603433]
本稿では,3つの特徴ベクトルから行動が生成され,テンソルで表現できる,低ランクな文脈帯域モデルを提案する。
探索と利用のトレードオフを効果的に実現するために,我々は「一般化低ランク部分空間を再定義する」という新しいアルゴリズムを導入する(G-LowTESTR)。
厳密な理論解析により、G-LowTESTRの後悔境界はベクトル化や行列化の場合よりも優れていることが示されている。
論文 参考訳(メタデータ) (2023-11-03T08:12:05Z) - Low-Rank Tensor Completion via Novel Sparsity-Inducing Regularizers [30.920908325825668]
低ランクテンソル完備化問題において、l1-ノルムを緩和するため、非ランクサロゲート/正則化器が提案されている。
これらの正則化器は核ランク復元に適用され,乗算器法に基づく効率的なアルゴリズムが提案されている。
論文 参考訳(メタデータ) (2023-10-10T01:00:13Z) - Tight Certified Robustness via Min-Max Representations of ReLU Neural
Networks [9.771011198361865]
制御システムにニューラルネットワークを確実に配置するには、厳格な堅牢性を保証する必要がある。
本稿では,ReLUニューラルネットワークの凸表現に対する強靭性証明を得る。
論文 参考訳(メタデータ) (2023-10-07T21:07:45Z) - Out-of-distributional risk bounds for neural operators with applications
to the Helmholtz equation [6.296104145657063]
既存のニューラル演算子(NO)は、全ての物理問題に対して必ずしもうまく機能しない。
非線形作用素の波動速度を解にマッピングする実験的な近似を可能にするNOのサブファミリーを提案する。
本実験は, 深度導入の一般化と関連性において, ある種のサプライズを明らかにするものである。
我々は、NOsのサブファミリーのハイパーネットワークバージョンを、前述のフォワード演算子のサロゲートモデルとして提案することで結論付ける。
論文 参考訳(メタデータ) (2023-01-27T03:02:12Z) - Robust lEarned Shrinkage-Thresholding (REST): Robust unrolling for
sparse recover [87.28082715343896]
我々は、モデルミス特定を前進させるのに堅牢な逆問題を解決するためのディープニューラルネットワークについて検討する。
我々は,アルゴリズムの展開手法を根底にある回復問題のロバストバージョンに適用することにより,新しい堅牢なディープニューラルネットワークアーキテクチャを設計する。
提案したRESTネットワークは,圧縮センシングとレーダイメージングの両問題において,最先端のモデルベースおよびデータ駆動アルゴリズムを上回る性能を示す。
論文 参考訳(メタデータ) (2021-10-20T06:15:45Z) - A Unifying Theory of Thompson Sampling for Continuous Risk-Averse
Bandits [91.3755431537592]
本稿では,多腕バンディット問題に対するリスク-逆トンプソンサンプリングアルゴリズムの解析を統一する。
大規模偏差理論における収縮原理を用いることで、連続リスク汎関数に対する新しい濃度境界が証明される。
リスク関数の幅広いクラスと「ニセ」関数が連続性条件を満たすことを示す。
論文 参考訳(メタデータ) (2021-08-25T17:09:01Z) - Regularized OFU: an Efficient UCB Estimator forNon-linear Contextual
Bandit [90.0208037317206]
両立探索と搾取(EE)は、同性間の盗賊の根本的問題である。
ROFU(ROFU)という新しいOFUアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-06-29T07:28:15Z) - Provable Model-based Nonlinear Bandit and Reinforcement Learning: Shelve
Optimism, Embrace Virtual Curvature [61.22680308681648]
決定論的報酬を有する1層ニューラルネットバンディットにおいても,グローバル収束は統計的に難解であることを示す。
非線形バンディットとRLの両方に対して,オンラインモデル学習者による仮想アセンジ(Virtual Ascent with Online Model Learner)というモデルベースアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-08T12:41:56Z) - Shaping Deep Feature Space towards Gaussian Mixture for Visual
Classification [74.48695037007306]
視覚分類のためのディープニューラルネットワークのためのガウス混合損失関数(GM)を提案する。
分類マージンと可能性正規化により、GM損失は高い分類性能と特徴分布の正確なモデリングの両方を促進する。
提案したモデルは、追加のトレーニング可能なパラメータを使わずに、簡単かつ効率的に実装できる。
論文 参考訳(メタデータ) (2020-11-18T03:32:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。