論文の概要: Composing Task Knowledge with Modular Successor Feature Approximators
- arxiv url: http://arxiv.org/abs/2301.12305v1
- Date: Sat, 28 Jan 2023 23:04:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-31 17:51:44.025560
- Title: Composing Task Knowledge with Modular Successor Feature Approximators
- Title(参考訳): Modular Successor Feature Approximatorによるタスク知識の構成
- Authors: Wilka Carvalho, Angelos Filos, Richard L. Lewis, Honglak lee and
Satinder Singh
- Abstract要約: 本稿では,新しいニューラルネットワークアーキテクチャ "Modular Successor Feature Approximator" (MSFA) を提案する。
MSFAは、SFやモジュールアーキテクチャを学ぶためのベースラインアーキテクチャと比較して、より一般化することができる。
- 参考スコア(独自算出の注目度): 63.24647342766857
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, the Successor Features and Generalized Policy Improvement (SF&GPI)
framework has been proposed as a method for learning, composing, and
transferring predictive knowledge and behavior. SF&GPI works by having an agent
learn predictive representations (SFs) that can be combined for transfer to new
tasks with GPI. However, to be effective this approach requires state features
that are useful to predict, and these state-features are typically
hand-designed. In this work, we present a novel neural network architecture,
"Modular Successor Feature Approximators" (MSFA), where modules both discover
what is useful to predict, and learn their own predictive representations. We
show that MSFA is able to better generalize compared to baseline architectures
for learning SFs and modular architectures
- Abstract(参考訳): 近年,予測知識と行動の学習,構成,伝達の手段として,後継機能と一般化政策改善(sf&gpi)フレームワークが提案されている。
SF&GPIはエージェントに予測表現(SF)を学習させ、GPIで新しいタスクに移行させる。
しかし、このアプローチを効果的にするためには、予測に有用な状態機能が必要であり、これらの状態機能は通常手作業で設計される。
本研究では,新しいニューラルネットワークアーキテクチャである"Modular Successor Feature Approximator"(MSFA)を提案する。
SFやモジュールアーキテクチャを学習するベースラインアーキテクチャと比較して,MSFAがより一般化可能であることを示す。
関連論文リスト
- SG-MIM: Structured Knowledge Guided Efficient Pre-training for Dense Prediction [17.44991827937427]
マスク付き画像モデリング技術はコンピュータビジョンの景観を再定義した。
その成功にもかかわらず、密集予測タスク、特に深度推定におけるMIMベースの手法の可能性は未解決のままである。
SG-MIM(Structured Knowledge Guided Masked Image Modeling framework)を提案する。
論文 参考訳(メタデータ) (2024-09-04T08:24:53Z) - HPT++: Hierarchically Prompting Vision-Language Models with Multi-Granularity Knowledge Generation and Improved Structure Modeling [39.14392943549792]
本稿では,階層型プロンプトチューニング(HPT)と呼ばれる新しい手法を提案し,構造化知識と従来の言語知識の同時モデリングを可能にする。
低レベルの即時学習のためのエンティティと属性間のペアワイズ関連をキャプチャする、関係誘導型アテンションモジュールを導入する。
全体意味論をモデル化する高レベルかつグローバルレベルのプロンプトを取り入れることで、提案された階層構造は、クロスレベルな相互リンクを偽造し、より複雑で長期的な関係を扱うようにモデルに権限を与える。
論文 参考訳(メタデータ) (2024-08-27T06:50:28Z) - On the verification of Embeddings using Hybrid Markov Logic [2.113770213797994]
本稿では,学習した表現の複雑な性質を検証するためのフレームワークを提案する。
このフレームワーク内のプロパティのパラメータを学習するためのアプローチを提案する。
本稿では,グラフニューラルネットワーク,深部知識追跡,知能学習システムにおける検証について述べる。
論文 参考訳(メタデータ) (2023-12-13T17:04:09Z) - Combining Behaviors with the Successor Features Keyboard [55.983751286962985]
SFK(Successor Features Keyboard)は、検出された状態特徴とタスクエンコーディングによる転送を可能にする。
難易度の高い3次元環境において, SFによる移動を初めて実演する。
論文 参考訳(メタデータ) (2023-10-24T15:35:54Z) - An Expectation-Maximization Perspective on Federated Learning [75.67515842938299]
フェデレーション学習は、データをデバイス上でプライベートにしながら、複数のクライアントにわたるモデルの分散トレーニングを記述する。
本稿では,サーバがクライアント固有のモデルパラメータに対して事前分布のパラメータを提供する階層的潜在変数モデルとして,サーバが設定したフェデレーション学習プロセスについて考察する。
我々は,単純なガウス先行とよく知られた期待最大化(EM)アルゴリズムのハードバージョンを用いて,そのようなモデルの学習は,フェデレーション学習環境における最も一般的なアルゴリズムであるFedAvgに対応することを示す。
論文 参考訳(メタデータ) (2021-11-19T12:58:59Z) - Multi-Branch Deep Radial Basis Function Networks for Facial Emotion
Recognition [80.35852245488043]
放射状基底関数(RBF)ユニットによって形成された複数の分岐で拡張されたCNNベースのアーキテクチャを提案する。
RBFユニットは、中間表現を用いて類似のインスタンスで共有される局所パターンをキャプチャする。
提案手法は,提案手法の競争力を高めるためのローカル情報の導入であることを示す。
論文 参考訳(メタデータ) (2021-09-07T21:05:56Z) - How Fine-Tuning Allows for Effective Meta-Learning [50.17896588738377]
MAMLライクなアルゴリズムから派生した表現を解析するための理論的フレームワークを提案する。
我々は,勾配降下による微調整により得られる最良予測器のリスク境界を提示し,アルゴリズムが共有構造を有効活用できることを実証する。
この分離の結果、マイニングベースのメソッド、例えばmamlは、少数ショット学習における"frozen representation"目標を持つメソッドよりも優れている。
論文 参考訳(メタデータ) (2021-05-05T17:56:00Z) - Edge-assisted Democratized Learning Towards Federated Analytics [67.44078999945722]
本稿では,エッジ支援型民主化学習機構であるEdge-DemLearnの階層的学習構造を示す。
また、Edge-DemLearnを柔軟なモデルトレーニングメカニズムとして検証し、リージョンに分散制御と集約の方法論を構築する。
論文 参考訳(メタデータ) (2020-12-01T11:46:03Z) - Compositional Generalization in Semantic Parsing: Pre-training vs.
Specialized Architectures [1.8434042562191812]
事前トレーニングは、同等の非事前トレーニングモデルと比較して、パフォーマンスが大幅に向上することを示す。
我々は、中間表現とともに事前学習を用いて、CFQ合成一般化ベンチマークの新たな技術状態を確立する。
論文 参考訳(メタデータ) (2020-07-17T13:34:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。