論文の概要: Learning Shared Representations for Multi-Task Linear Bandits
- arxiv url: http://arxiv.org/abs/2604.00531v1
- Date: Wed, 01 Apr 2026 06:18:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-02 16:44:31.86749
- Title: Learning Shared Representations for Multi-Task Linear Bandits
- Title(参考訳): マルチタスク線形帯域における共有表現の学習
- Authors: Jiabin Lin, Shana Moothedath,
- Abstract要約: マルチタスク表現学習は、関連するタスク間で共有潜在表現を学習するアプローチである。
特徴次元 d を持つ T の並列線型バンドイットタスクは、次元 r ll Mind,T$ の共通潜在表現を共有する。
我々は、共有低ランク表現を利用して意思決定を強化する、顔の不確かさリニア(OFUL)アルゴリズムの新たな最適化を提案する。
- 参考スコア(独自算出の注目度): 7.978226788634307
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-task representation learning is an approach that learns shared latent representations across related tasks, facilitating knowledge transfer and improving sample efficiency. This paper introduces a novel approach to multi-task representation learning in linear bandits. We consider a setting with T concurrent linear bandit tasks, each with feature dimension d, that share a common latent representation of dimension r \ll min{d,T}$, capturing their underlying relatedness. We propose a new Optimism in the Face of Uncertainty Linear (OFUL) algorithm that leverages shared low-rank representations to enhance decision-making in a sample-efficient manner. Our algorithm first collects data through an exploration phase, estimates the shared model via spectral initialization, and then conducts OFUL based learning over a newly constructed confidence set. We provide theoretical guarantees for the confidence set and prove that the unknown reward vectors lie within the confidence set with high probability. We derive cumulative regret bounds and show that the proposed approach achieves \tilde{O}(\sqrt{drNT}), a significant improvement over solving the T tasks independently, resulting in a regret of \tilde{O}(dT\sqrt{N}). We performed numerical simulations to validate the performance of our algorithm for different problem sizes.
- Abstract(参考訳): マルチタスク表現学習は、関連するタスク間で共有潜在表現を学習し、知識伝達を容易にし、サンプル効率を向上させるアプローチである。
本稿では,線形帯域におけるマルチタスク表現学習に対する新しいアプローチを提案する。
特徴次元 d を持つ T の並列線型バンドイットタスクは、その基礎となる関係性を捉えながら、次元 r \ll min{d,T}$ の共通の潜在表現を共有する。
我々は,共有低ランク表現を利用した顔不確かさ線形(OFUL)アルゴリズムを提案する。
提案アルゴリズムは,まず探索段階からデータを収集し,スペクトル初期化により共有モデルを推定し,新たに構築された信頼度集合上でOFULに基づく学習を行う。
我々は、信頼集合の理論的な保証を提供し、未知の報酬ベクトルが高い確率で信頼集合の中に存在することを証明する。
累積的後悔境界を導出し、提案手法が T のタスクを独立に解くよりも顕著な改善である \tilde{O}(\sqrt{drNT}) を達成し、結果として \tilde{O}(dT\sqrt{N}) の後悔をもたらすことを示す。
我々は,異なる問題サイズに対するアルゴリズムの性能評価のために,数値シミュレーションを行った。
関連論文リスト
- On Discriminative Probabilistic Modeling for Self-Supervised Representation Learning [85.75164588939185]
本研究では,(マルチモーダル)自己教師型表現学習のデータ予測タスクにおいて,連続領域における識別確率モデルについて検討する。
我々は、自己教師付き表現学習における現在のInfoNCEに基づくコントラスト損失の制限を明らかにするために一般化誤差解析を行う。
MISが要求する条件付き確率密度の和を近似する新しい非パラメトリック手法を提案する。
論文 参考訳(メタデータ) (2024-10-11T18:02:46Z) - Fast and Sample Efficient Multi-Task Representation Learning in Stochastic Contextual Bandits [15.342585350280535]
本研究では,表現学習が文脈的包帯問題の学習効率を向上させる方法について検討する。
本稿では,予測勾配勾配(GD)と最小化推定器に基づく新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-02T22:30:29Z) - Stochastic Unrolled Federated Learning [85.6993263983062]
本稿では,UnRolled Federated Learning (SURF)を導入する。
提案手法は,この拡張における2つの課題,すなわち,非学習者へのデータセット全体の供給の必要性と,フェデレート学習の分散的性質に対処する。
論文 参考訳(メタデータ) (2023-05-24T17:26:22Z) - Non-Stationary Representation Learning in Sequential Linear Bandits [22.16801879707937]
非定常環境におけるマルチタスク意思決定のための表現学習について検討する。
本研究では,非定常表現を適応的に学習し,伝達することにより,効率的な意思決定を容易にするオンラインアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-01-13T06:13:03Z) - Byzantine Resilient Distributed Multi-Task Learning [6.850757447639822]
タスク間の関連性を学習するための分散アルゴリズムは、ビザンティンエージェントの存在下では回復力がないことを示す。
ビザンチンレジリエントな分散マルチタスク学習のためのアプローチを提案する。
論文 参考訳(メタデータ) (2020-10-25T04:32:52Z) - Task-Feature Collaborative Learning with Application to Personalized
Attribute Prediction [166.87111665908333]
本稿では,TFCL(Task-Feature Collaborative Learning)と呼ばれる新しいマルチタスク学習手法を提案する。
具体的には、まず、特徴とタスクの協調的なグループ化を活用するために、不均一なブロック対角構造正規化器を用いたベースモデルを提案する。
実際の拡張として,重なり合う機能と難易度を区別することで,基本モデルを拡張します。
論文 参考訳(メタデータ) (2020-04-29T02:32:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。