論文の概要: Non-Stationary Representation Learning in Sequential Linear Bandits
- arxiv url: http://arxiv.org/abs/2201.04805v1
- Date: Thu, 13 Jan 2022 06:13:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-14 23:52:40.224898
- Title: Non-Stationary Representation Learning in Sequential Linear Bandits
- Title(参考訳): 連続線形帯域における非定常表現学習
- Authors: Yuzhen Qin, Tommaso Menara, Samet Oymak, ShiNung Ching, and Fabio
Pasqualetti
- Abstract要約: 非定常環境におけるマルチタスク意思決定のための表現学習について検討する。
本研究では,非定常表現を適応的に学習し,伝達することにより,効率的な意思決定を容易にするオンラインアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 22.16801879707937
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we study representation learning for multi-task
decision-making in non-stationary environments. We consider the framework of
sequential linear bandits, where the agent performs a series of tasks drawn
from distinct sets associated with different environments. The embeddings of
tasks in each set share a low-dimensional feature extractor called
representation, and representations are different across sets. We propose an
online algorithm that facilitates efficient decision-making by learning and
transferring non-stationary representations in an adaptive fashion. We prove
that our algorithm significantly outperforms the existing ones that treat tasks
independently. We also conduct experiments using both synthetic and real data
to validate our theoretical insights and demonstrate the efficacy of our
algorithm.
- Abstract(参考訳): 本稿では,非定常環境におけるマルチタスク意思決定のための表現学習について検討する。
エージェントは異なる環境に関連付けられた異なる集合から引き出された一連のタスクを実行する。
各集合へのタスクの埋め込みは表現と呼ばれる低次元の特徴抽出器を共有し、表現は集合間で異なる。
本稿では,非定常表現を適応的に学習・伝達することにより,効率的な意思決定を容易にするオンラインアルゴリズムを提案する。
我々のアルゴリズムがタスクを独立に扱う既存のアルゴリズムを大幅に上回っていることを証明します。
また, 合成データと実データの両方を用いて実験を行い, 理論的知見を検証し, アルゴリズムの有効性を実証した。
関連論文リスト
- Leveraging sparse and shared feature activations for disentangled
representation learning [112.22699167017471]
本稿では,教師付きタスクの多種多様な集合から抽出した知識を活用し,共通不整合表現を学習することを提案する。
我々は6つの実世界分布シフトベンチマークと異なるデータモダリティに対するアプローチを検証する。
論文 参考訳(メタデータ) (2023-04-17T01:33:24Z) - Multi-Task Self-Supervised Time-Series Representation Learning [3.31490164885582]
時系列表現学習は、時間的ダイナミクスとスパースラベルを持つデータから表現を抽出することができる。
自己教師型タスクの利点を組み合わせた時系列表現学習手法を提案する。
本稿では,時系列分類,予測,異常検出という3つのダウンストリームタスクの枠組みについて検討する。
論文 参考訳(メタデータ) (2023-03-02T07:44:06Z) - Multi-task Representation Learning for Pure Exploration in Linear
Bandits [34.67303292713379]
線形包帯(RepBAI-LB)におけるベストアーム識別のためのマルチタスク表現学習と文脈線形包帯(RepBPI-CLB)におけるベストポリシー識別について検討する。
これら2つの問題において、全てのタスクが共通の低次元線形表現を共有しており、我々のゴールは、この機能を活用して全てのタスクの最高のアーム(政治)識別プロセスを加速することである。
タスク間の共通表現を学習することで、我々のサンプルの複雑さはタスクを独立して解決するネイティブアプローチよりもはるかに優れていることを示す。
論文 参考訳(メタデータ) (2023-02-09T05:14:48Z) - Multi-task Bias-Variance Trade-off Through Functional Constraints [102.64082402388192]
マルチタスク学習は、多様なタスクによく機能する関数の集合を取得することを目的としている。
本稿では,2つの極端な学習シナリオ,すなわちすべてのタスクに対する単一関数と,他のタスクを無視するタスク固有関数から直感を抽出する。
本稿では,集中関数に対するドメイン固有解を強制する制約付き学習定式化を導入する。
論文 参考訳(メタデータ) (2022-10-27T16:06:47Z) - Active Multi-Task Representation Learning [50.13453053304159]
本研究は,アクティブラーニングの手法を活用することで,資源タスクのサンプリングに関する最初の公式な研究を行う。
提案手法は, 対象タスクに対する各ソースタスクの関連性を反復的に推定し, その関連性に基づいて各ソースタスクからサンプルを抽出するアルゴリズムである。
論文 参考訳(メタデータ) (2022-02-02T08:23:24Z) - On the relationship between disentanglement and multi-task learning [62.997667081978825]
ハードパラメータ共有に基づくマルチタスク学習と絡み合いの関係について,より詳しく検討する。
マルチタスクニューラルネットワークトレーニングの過程において, 絡み合いが自然に現れることを示す。
論文 参考訳(メタデータ) (2021-10-07T14:35:34Z) - Pretext Tasks selection for multitask self-supervised speech
representation learning [23.39079406674442]
提案手法では,候補群の中からプレテキストタスク群を選択する手法を提案する。
話者認識と自動音声認識の実験により,我々のアプローチが検証された。
論文 参考訳(メタデータ) (2021-07-01T16:36:29Z) - How Fine-Tuning Allows for Effective Meta-Learning [50.17896588738377]
MAMLライクなアルゴリズムから派生した表現を解析するための理論的フレームワークを提案する。
我々は,勾配降下による微調整により得られる最良予測器のリスク境界を提示し,アルゴリズムが共有構造を有効活用できることを実証する。
この分離の結果、マイニングベースのメソッド、例えばmamlは、少数ショット学習における"frozen representation"目標を持つメソッドよりも優れている。
論文 参考訳(メタデータ) (2021-05-05T17:56:00Z) - Conditional Meta-Learning of Linear Representations [57.90025697492041]
表現学習のための標準メタラーニングは、複数のタスク間で共有される共通の表現を見つけることを目的とする。
本研究では,タスクの側情報を手作業に適した表現にマッピングし,条件付け関数を推定することで,この問題を克服する。
この利点を実用的に活用できるメタアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-30T12:02:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。