論文の概要: Symmetric Linear Bandits with Hidden Symmetry
- arxiv url: http://arxiv.org/abs/2405.13899v1
- Date: Wed, 22 May 2024 18:11:57 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-24 20:43:22.443248
- Title: Symmetric Linear Bandits with Hidden Symmetry
- Title(参考訳): 隠れ対称性を持つ対称線形帯域
- Authors: Nam Phuong Tran, The Anh Ta, Debmalya Mandal, Long Tran-Thanh,
- Abstract要約: 学習者から対称性を隠蔽する高次元対称線形包帯について検討する。
低次元部分空間の集合におけるモデル選択に基づく手法を提案する。
- 参考スコア(独自算出の注目度): 17.40632789343385
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: High-dimensional linear bandits with low-dimensional structure have received considerable attention in recent studies due to their practical significance. The most common structure in the literature is sparsity. However, it may not be available in practice. Symmetry, where the reward is invariant under certain groups of transformations on the set of arms, is another important inductive bias in the high-dimensional case that covers many standard structures, including sparsity. In this work, we study high-dimensional symmetric linear bandits where the symmetry is hidden from the learner, and the correct symmetry needs to be learned in an online setting. We examine the structure of a collection of hidden symmetry and provide a method based on model selection within the collection of low-dimensional subspaces. Our algorithm achieves a regret bound of $ O(d_0^{1/3} T^{2/3} \log(d))$, where $d$ is the ambient dimension which is potentially very large, and $d_0$ is the dimension of the true low-dimensional subspace such that $d_0 \ll d$. With an extra assumption on well-separated models, we can further improve the regret to $ O(d_0\sqrt{T\log(d)} )$.
- Abstract(参考訳): 低次元構造を持つ高次元線形帯域は、その実用的意義から近年大きな注目を集めている。
文学における最も一般的な構造は空間性である。
しかし、実際には利用できない可能性がある。
対称性は、腕の集合上のある種の変換群の下で報酬が不変であり、空間性を含む多くの標準構造をカバーする高次元の場合において、別の重要な帰納バイアスである。
本研究では,学習者から対称性を隠蔽する高次元対称線形帯域について検討し,オンライン環境で適切な対称性を学習する必要がある。
隠れ対称性の集合の構造を考察し、低次元部分空間の集合内のモデル選択に基づく方法を提案する。
我々のアルゴリズムは、$ O(d_0^{1/3} T^{2/3} \log(d))$ の後悔境界を達成し、$d$ は、潜在的に非常に大きい周囲次元であり、$d_0$ は、$d_0 \ll d$ のような真の低次元部分空間の次元である。
十分に分離されたモデルに余分な仮定を加えると、その後悔は$ O(d_0\sqrt{T\log(d)} )$ にさらに改善できる。
関連論文リスト
- Linear Convergence of Diffusion Models Under the Manifold Hypothesis [5.040884755454258]
クルバック・リーブラー(KL)の発散に収束するステップの数は、内在次元$Leid$における線型(対数項まで)であることが示される。
また、この線形依存は鋭いことを示す。
論文 参考訳(メタデータ) (2024-10-11T17:58:30Z) - Equivariant Symmetry Breaking Sets [0.6475999521931204]
等価ニューラルネットワーク(ENN)は、基礎となる対称性を含むアプリケーションに非常に効果的であることが示されている。
完全同変で、自発対称性の破れに対処する最初のフレームワークである新しい対称性破れフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-05T02:35:11Z) - Effective Minkowski Dimension of Deep Nonparametric Regression: Function
Approximation and Statistical Theories [70.90012822736988]
ディープ非パラメトリック回帰に関する既存の理論は、入力データが低次元多様体上にある場合、ディープニューラルネットワークは本質的なデータ構造に適応できることを示した。
本稿では,$mathcalS$で表される$mathbbRd$のサブセットに入力データが集中するという緩和された仮定を導入する。
論文 参考訳(メタデータ) (2023-06-26T17:13:31Z) - Deep Learning Symmetries and Their Lie Groups, Algebras, and Subalgebras
from First Principles [55.41644538483948]
ラベル付きデータセットに存在する連続した対称性群の検出と同定のためのディープラーニングアルゴリズムを設計する。
完全に接続されたニューラルネットワークを用いて、変換対称性と対応するジェネレータをモデル化する。
また,Lie群とその性質の数学的研究に機械学習アプローチを使うための扉を開く。
論文 参考訳(メタデータ) (2023-01-13T16:25:25Z) - Linear programming with unitary-equivariant constraints [2.0305676256390934]
ユニタリ同値(英: Unitary equivariance)は、物理学や数学において多くの文脈で発生する自然な対称性である。
追加の対称性の仮定の下では、この問題は、$d$でスケールしない時間で解決できる線形プログラムに還元されることを示す。
また,本手法を一般ユニタリ同変半定プログラムに拡張する可能性についても概説する。
論文 参考訳(メタデータ) (2022-07-12T17:37:04Z) - Machine learning a manifold [0.0]
人工ニューラルネットワークによる回帰によるデータセットの連続リー代数対称性の同定法を提案する。
我々の提案は、入力変数上の無限小対称性変換の下での出力変数のスケーリングを$mathcalO(epsilon2)$に活用する。
論文 参考訳(メタデータ) (2021-12-14T19:00:00Z) - High-Dimensional Sparse Linear Bandits [67.9378546011416]
データ・ポーア・システマティクスにおける疎線形包帯に対して、新しい$Omega(n2/3)$ dimension-free minimax regret lower boundを導出する。
また、関連する特徴に対する信号の大きさに関する追加の仮定の下で、次元のない$O(sqrtn)$ regret上界も証明する。
論文 参考訳(メタデータ) (2020-11-08T16:48:11Z) - Online Sparse Reinforcement Learning [60.44832065993122]
固定地平線, スパース線形決定過程(MDP)におけるオンライン強化学習の難しさについて検討する。
この場合、よく条件付きデータを収集するポリシーが存在するとしても、線形後悔は一般的に避けられないことを示す。
このことは、大規模な行動において、学習の難しさは、優れた探索政策を見つけるのが困難であることに起因していることを示している。
論文 参考訳(メタデータ) (2020-11-08T16:47:42Z) - Nearly Dimension-Independent Sparse Linear Bandit over Small Action
Spaces via Best Subset Selection [71.9765117768556]
本研究では,高次元線形モデルの下での文脈的帯域問題について考察する。
この設定は、パーソナライズされたレコメンデーション、オンライン広告、パーソナライズされた医療など、不可欠な応用を見出す。
本稿では,最適部分集合選択法を用いて2重成長エポックを推定する手法を提案する。
論文 参考訳(メタデータ) (2020-09-04T04:10:39Z) - A deep network construction that adapts to intrinsic dimensionality
beyond the domain [79.23797234241471]
本稿では,ReLUを活性化したディープネットワークを用いて,2層合成の近似を$f(x) = g(phi(x))$で検討する。
例えば、低次元埋め込み部分多様体への射影と、低次元集合の集合への距離である。
論文 参考訳(メタデータ) (2020-08-06T09:50:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。