論文の概要: Combined Model for Partially-Observable and Non-Observable Task
Switching: Solving Hierarchical Reinforcement Learning Problems Statically
and Dynamically with Transfer Learning
- arxiv url: http://arxiv.org/abs/2004.06213v2
- Date: Wed, 22 Apr 2020 18:45:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-14 00:02:25.200958
- Title: Combined Model for Partially-Observable and Non-Observable Task
Switching: Solving Hierarchical Reinforcement Learning Problems Statically
and Dynamically with Transfer Learning
- Title(参考訳): 部分観測型および非観測型タスクスイッチングのための複合モデル--階層強化学習問題を静的および動的にトランスファー学習で解く
- Authors: Nibraas Khan and Joshua Phillips
- Abstract要約: 人間と動物は、作業記憶(WM)と呼ばれるこの焦点を達成するために、PFC(Pre-Frontal Cortex)とBG(Basal Ganglia)の相互作用に依存している。
ツールキットの最近の適応では、抽象タスク表現(ATR)を用いて非可観測(NO)タスクを解くか、過去の入力機能の記憶によって部分可観測(PO)タスクを解くが、両方ではない。
本稿では,ATRと入力ストレージの両方のアプローチを静的あるいは動的に組み合わせた新しいモデルPONOWMtkを提案する。
- 参考スコア(独自算出の注目度): 2.741266294612776
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: An integral function of fully autonomous robots and humans is the ability to
focus attention on a few relevant percepts to reach a certain goal while
disregarding irrelevant percepts. Humans and animals rely on the interactions
between the Pre-Frontal Cortex (PFC) and the Basal Ganglia (BG) to achieve this
focus called Working Memory (WM). The Working Memory Toolkit (WMtk) was
developed based on a computational neuroscience model of this phenomenon with
Temporal Difference (TD) Learning for autonomous systems. Recent adaptations of
the toolkit either utilize Abstract Task Representations (ATRs) to solve
Non-Observable (NO) tasks or storage of past input features to solve
Partially-Observable (PO) tasks, but not both. We propose a new model,
PONOWMtk, which combines both approaches, ATRs and input storage, with a static
or dynamic number of ATRs. The results of our experiments show that PONOWMtk
performs effectively for tasks that exhibit PO, NO, or both properties.
- Abstract(参考訳): 完全自律ロボットと人間の不可欠な機能は、無関係な知覚を無視しながら、特定の目標を達成するためにいくつかの関連する知覚に注意を向ける能力である。
人間と動物は、作業記憶(WM)と呼ばれるこの焦点を達成するために、PFC(Pre-Frontal Cortex)とBG(Basal Ganglia)の相互作用に依存している。
ワーキングメモリツールキット(wmtk)は、自律システムのための時間差学習(td)を伴うこの現象の計算神経科学モデルに基づいて開発された。
ツールキットの最近の適応では、抽象タスク表現(ATR)を用いて非可観測(NO)タスクを解くか、過去の入力機能の記憶によって部分可観測(PO)タスクを解くが、両方ではない。
本稿では,ATRと入力ストレージの両方のアプローチを静的あるいは動的に組み合わせた新しいモデルPONOWMtkを提案する。
実験の結果,PO,NO,あるいは両方の特性を示すタスクに対して,PONOWMtkが効果的に動作することがわかった。
関連論文リスト
- Sparse Multitask Learning for Efficient Neural Representation of Motor
Imagery and Execution [30.186917337606477]
運動画像(MI)と運動実行(ME)タスクのためのスパースマルチタスク学習フレームワークを提案する。
MI-ME分類のためのデュアルタスクCNNモデルが与えられた場合、過渡的な接続に対して、サリエンシに基づくスペーシフィケーションアプローチを適用する。
以上の結果から, この調整された疎水性は, 過度に適合する問題を緩和し, 少ないデータ量でテスト性能を向上させることが示唆された。
論文 参考訳(メタデータ) (2023-12-10T09:06:16Z) - Towards a Unified Transformer-based Framework for Scene Graph Generation
and Human-object Interaction Detection [116.21529970404653]
本稿では,Transformerアーキテクチャに基づく一段階統一モデルであるSG2HOI+を紹介する。
本手法では,SGGとHOI検出のタスクをシームレスに統一する2つの対話型階層変換器を用いる。
提案手法は最先端のHOI法と比較して競争性能が向上する。
論文 参考訳(メタデータ) (2023-11-03T07:25:57Z) - Task-Aware Asynchronous Multi-Task Model with Class Incremental
Contrastive Learning for Surgical Scene Understanding [17.80234074699157]
手術報告生成とツール-タスク間相互作用予測のためのマルチタスク学習モデルを提案する。
共有特徴抽出器のモデル形式,キャプション用メッシュ・トランスフォーマブランチ,ツールとタスク間の相互作用予測のためのグラフアテンションブランチ。
タスク認識型非同期MTL最適化手法を組み込んで,共有重みを微調整し,両タスクを最適に収束させる。
論文 参考訳(メタデータ) (2022-11-28T14:08:48Z) - The impact of memory on learning sequence-to-sequence tasks [6.603326895384289]
自然言語処理におけるニューラルネットワークの最近の成功は、シーケンシャル・ツー・シーケンス(seq2seq)タスクに新たな注目を集めている。
本稿では,シークエンスにおけるメモリの次数,すなわち非マルコビアン性に対する明示的な制御の利点を生かしたSeq2seqタスクのモデルを提案する。
論文 参考訳(メタデータ) (2022-05-29T14:57:33Z) - Continual Object Detection via Prototypical Task Correlation Guided
Gating Mechanism [120.1998866178014]
pRotOtypeal taSk corrElaTion guided gaTingAnism (ROSETTA)による連続物体検出のためのフレキシブルなフレームワークを提案する。
具体的には、統一されたフレームワークはすべてのタスクで共有され、タスク対応ゲートは特定のタスクのサブモデルを自動的に選択するために導入されます。
COCO-VOC、KITTI-Kitchen、VOCのクラスインクリメンタル検出、および4つのタスクの逐次学習の実験により、ROSETTAが最先端のパフォーマンスを得ることが示された。
論文 参考訳(メタデータ) (2022-05-06T07:31:28Z) - SMEMO: Social Memory for Trajectory Forecasting [34.542209630734234]
本稿では、外部記憶装置として機能するエンドツーエンドのトレーニング可能なワーキングメモリに基づくニューラルネットワークを提案する。
提案手法は,異なるエージェントの動き間の説明可能な因果関係を学習し,軌跡予測データセットの最先端結果を得ることができることを示す。
論文 参考訳(メタデータ) (2022-03-23T14:40:20Z) - Learning Bayesian Sparse Networks with Full Experience Replay for
Continual Learning [54.7584721943286]
継続学習(CL)手法は、機械学習モデルが、以前にマスターされたタスクを壊滅的に忘れることなく、新しいタスクを学習できるようにすることを目的としている。
既存のCLアプローチは、しばしば、事前に確認されたサンプルのバッファを保持し、知識蒸留を行い、あるいはこの目標に向けて正規化技術を使用する。
我々は,現在および過去のタスクを任意の段階で学習するために,スパースニューロンのみを活性化し,選択することを提案する。
論文 参考訳(メタデータ) (2022-02-21T13:25:03Z) - Domain Adaptive Robotic Gesture Recognition with Unsupervised
Kinematic-Visual Data Alignment [60.31418655784291]
本稿では,マルチモダリティ知識,すなわちキネマティックデータとビジュアルデータを同時にシミュレータから実ロボットに伝達できる,教師なしドメイン適応フレームワークを提案する。
ビデオの時間的手がかりと、ジェスチャー認識に対するマルチモーダル固有の相関を用いて、トランスファー可能な機能を強化したドメインギャップを修復する。
その結果, 本手法は, ACCでは最大12.91%, F1scoreでは20.16%と, 実際のロボットではアノテーションを使わずに性能を回復する。
論文 参考訳(メタデータ) (2021-03-06T09:10:03Z) - Multi-task Supervised Learning via Cross-learning [102.64082402388192]
我々は,様々なタスクを解くことを目的とした回帰関数の集合を適合させることで,マルチタスク学習と呼ばれる問題を考える。
我々の新しい定式化では、これらの関数のパラメータを2つに分けて、互いに近づきながらタスク固有のドメインで学習する。
これにより、異なるドメインにまたがって収集されたデータが、互いのタスクにおける学習パフォーマンスを改善するのに役立つ、クロス・ファーティライズが促進される。
論文 参考訳(メタデータ) (2020-10-24T21:35:57Z) - Efficient Inference of Flexible Interaction in Spiking-neuron Networks [41.83710212492543]
非線形ホークス法を用いて、ニューロン間の興奮的または抑制的な相互作用をモデル化する。
提案アルゴリズムは, 相互作用の時間的ダイナミクスを推定し, ニューラルスパイク列の根底にある機能的接続を明らかにする。
論文 参考訳(メタデータ) (2020-06-23T09:10:30Z) - Task-Feature Collaborative Learning with Application to Personalized
Attribute Prediction [166.87111665908333]
本稿では,TFCL(Task-Feature Collaborative Learning)と呼ばれる新しいマルチタスク学習手法を提案する。
具体的には、まず、特徴とタスクの協調的なグループ化を活用するために、不均一なブロック対角構造正規化器を用いたベースモデルを提案する。
実際の拡張として,重なり合う機能と難易度を区別することで,基本モデルを拡張します。
論文 参考訳(メタデータ) (2020-04-29T02:32:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。