論文の概要: Representation Learning for Context-Dependent Decision-Making
- arxiv url: http://arxiv.org/abs/2205.05820v1
- Date: Thu, 12 May 2022 01:06:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-14 01:32:54.563766
- Title: Representation Learning for Context-Dependent Decision-Making
- Title(参考訳): 文脈依存意思決定のための表現学習
- Authors: Yuzhen Qin, Tommaso Menara, Samet Oymak, ShiNung Ching, and Fabio
Pasqualetti
- Abstract要約: 文脈変化を伴う逐次意思決定シナリオにおける表現学習について検討する。
本稿では,文脈依存表現の学習と伝達が可能なオンラインアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 22.16801879707937
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Humans are capable of adjusting to changing environments flexibly and
quickly. Empirical evidence has revealed that representation learning plays a
crucial role in endowing humans with such a capability. Inspired by this
observation, we study representation learning in the sequential decision-making
scenario with contextual changes. We propose an online algorithm that is able
to learn and transfer context-dependent representations and show that it
significantly outperforms the existing ones that do not learn representations
adaptively. As a case study, we apply our algorithm to the Wisconsin Card
Sorting Task, a well-established test for the mental flexibility of humans in
sequential decision-making. By comparing our algorithm with the standard
Q-learning and Deep-Q learning algorithms, we demonstrate the benefits of
adaptive representation learning.
- Abstract(参考訳): 人間は環境の変化に柔軟かつ迅速に適応することができる。
実証的な証拠は、表現学習が人間にそのような能力を与える上で重要な役割を担っていることを明らかにしている。
本研究は,文脈変化を伴う逐次意思決定シナリオにおける表現学習について考察する。
本研究では,文脈依存表現を学習し,伝達することが可能なオンラインアルゴリズムを提案する。
ケーススタディとして、我々のアルゴリズムを、シーケンシャルな意思決定における人間の精神的柔軟性の確立されたテストであるウィスコンシンカードソーティングタスクに適用する。
本アルゴリズムと標準Q-ラーニングアルゴリズムとDeep-Qラーニングアルゴリズムを比較し,適応表現学習の利点を実証する。
- 全文 参考訳へのリンク
関連論文リスト
- Empirical Evaluation and Theoretical Analysis for Representation
Learning: A Survey [25.5633960013493]
表現学習により、データセットからジェネリックな特徴表現を自動的に抽出して、別の機械学習タスクを解決することができます。
近年,表現学習アルゴリズムと単純な予測器によって抽出された特徴表現は,複数の機械学習タスクにおいて最先端の性能を示す。
論文 参考訳(メタデータ) (2022-04-18T09:18:47Z) - Adversarial Learned Fair Representations using Dampening and Stacking [0.0]
公平な表現学習では、センシティブな変数が検閲されるデータの適切な表現を見つけることを任務としている。
最近の研究は、敵対的な学習を通して公正な表現を学ぶことを目的としている。
本研究は, 減衰と重ね合わせを用いて対向公正表現を学習する新しいアルゴリズムを導入することにより, 本研究を基礎にしている。
論文 参考訳(メタデータ) (2022-03-16T14:07:36Z) - Fortuitous Forgetting in Connectionist Networks [20.206607130719696]
我々は,ニューラルネットワークの学習軌跡を形成するための強力なパラダイムとして,"forget-and-relearn"を紹介した。
forget-and-relearnフレームワークは、画像分類と言語出現文学において、多くの既存の反復的トレーニングアルゴリズムを統合する。
我々は、この理解を活用して、よりターゲットを絞った忘れ操作を設計することで、既存のアルゴリズムを改善する。
論文 参考訳(メタデータ) (2022-02-01T00:15:58Z) - Rethinking Learning Dynamics in RL using Adversarial Networks [79.56118674435844]
本稿では,スキル埋め込み空間を通じてパラメータ化された,密接に関連するスキルの強化学習のための学習機構を提案する。
本研究の主な貢献は、エントロピー規則化政策勾配定式化の助けを借りて、強化学習のための敵の訓練体制を定式化することである。
論文 参考訳(メタデータ) (2022-01-27T19:51:09Z) - Non-Stationary Representation Learning in Sequential Linear Bandits [22.16801879707937]
非定常環境におけるマルチタスク意思決定のための表現学習について検討する。
本研究では,非定常表現を適応的に学習し,伝達することにより,効率的な意思決定を容易にするオンラインアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-01-13T06:13:03Z) - What Matters in Learning from Offline Human Demonstrations for Robot
Manipulation [64.43440450794495]
ロボット操作のための6つのオフライン学習アルゴリズムについて広範な研究を行う。
我々の研究は、オフラインの人間のデータから学習する際の最も重要な課題を分析します。
人間のデータセットから学ぶ機会を強調します。
論文 参考訳(メタデータ) (2021-08-06T20:48:30Z) - Co$^2$L: Contrastive Continual Learning [69.46643497220586]
近年の自己教師型学習のブレークスルーは、このようなアルゴリズムが視覚的な表現を学習し、見えないタスクにもっとうまく移行できることを示している。
本稿では、連続的な学習と伝達可能な表現の維持に焦点を当てたリハーサルに基づく連続学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-06-28T06:14:38Z) - Provably Efficient Representation Learning in Low-rank Markov Decision
Processes [78.83808048270306]
低ランクマルコフ決定過程(MDP)の表現学習に関する研究
本稿では,ReLEXと呼ばれる効率の良いアルゴリズムを提案し,その表現を同時に学習し,探索を行う。
論文 参考訳(メタデータ) (2021-06-22T17:16:50Z) - An Attribute-Aligned Strategy for Learning Speech Representation [57.891727280493015]
属性選択機構によってこれらの問題に柔軟に対処できる音声表現を導出する属性整合学習戦略を提案する。
具体的には、音声表現を属性依存ノードに分解する層式表現可変オートエンコーダ(LR-VAE)を提案する。
提案手法は,IDのないSER上での競合性能と,無感情SV上でのより良い性能を実現する。
論文 参考訳(メタデータ) (2021-06-05T06:19:14Z) - Curious Representation Learning for Embodied Intelligence [81.21764276106924]
近年,自己指導型表現学習は顕著な成功を収めている。
しかし、真にインテリジェントなエージェントを構築するためには、環境から学習できる表現学習アルゴリズムを構築する必要がある。
本稿では,強化学習方針と視覚的表現モデルを同時に学習する,好奇心をそそる表現学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-05-03T17:59:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。