論文の概要: Relate to Predict: Towards Task-Independent Knowledge Representations
for Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2212.05298v1
- Date: Sat, 10 Dec 2022 13:33:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-13 14:50:15.813715
- Title: Relate to Predict: Towards Task-Independent Knowledge Representations
for Reinforcement Learning
- Title(参考訳): 予測の関連性:強化学習のためのタスク非依存的知識表現を目指して
- Authors: Thomas Schn\"urer, Malte Probst, Horst-Michael Gross
- Abstract要約: 強化学習は、エージェントが複雑なタスクを学習できるようにする。
知識を解釈し、タスク間で再利用することは難しい。
本稿では,対象中心の知識分離を明示する帰納的バイアスを導入する。
知識分離における明示性の程度は、学習の高速化、精度の向上、一般化の向上、理解可能性の向上と相関していることを示す。
- 参考スコア(独自算出の注目度): 11.245432408899092
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reinforcement Learning (RL) can enable agents to learn complex tasks.
However, it is difficult to interpret the knowledge and reuse it across tasks.
Inductive biases can address such issues by explicitly providing generic yet
useful decomposition that is otherwise difficult or expensive to learn
implicitly. For example, object-centered approaches decompose a high
dimensional observation into individual objects. Expanding on this, we utilize
an inductive bias for explicit object-centered knowledge separation that
provides further decomposition into semantic representations and dynamics
knowledge. For this, we introduce a semantic module that predicts an objects'
semantic state based on its context. The resulting affordance-like object state
can then be used to enrich perceptual object representations. With a minimal
setup and an environment that enables puzzle-like tasks, we demonstrate the
feasibility and benefits of this approach. Specifically, we compare three
different methods of integrating semantic representations into a model-based RL
architecture. Our experiments show that the degree of explicitness in knowledge
separation correlates with faster learning, better accuracy, better
generalization, and better interpretability.
- Abstract(参考訳): 強化学習(RL)は、エージェントが複雑なタスクを学習できるようにする。
しかし、知識を解釈し、タスク間で再利用することは困難である。
帰納バイアスは、暗黙的に学ぶのが難しい、あるいは高価である汎用的で有用な分解を明示的に提供することにより、そのような問題に対処することができる。
例えば、オブジェクト中心のアプローチは、個々のオブジェクトに高次元の観察を分解する。
これに基づいて、私たちは、意味表現や動的知識へのさらなる分解を提供する明示的なオブジェクト指向知識分離に誘導バイアスを使用します。
そこで本研究では,オブジェクトのコンテキストに基づいたセマンティック状態を予測するセマンティックモジュールを提案する。
結果として生じる可測性のようなオブジェクト状態は、知覚的オブジェクト表現を豊かにするのに使われる。
最小限のセットアップとパズルのようなタスクを可能にする環境によって、このアプローチの実現性とメリットを実証する。
具体的には、意味表現をモデルベースRLアーキテクチャに統合する3つの異なる方法を比較する。
実験の結果,知識分離の明確性は,学習の高速化,正確性の向上,一般化,解釈性の向上と相関することが示された。
関連論文リスト
- Explaining the Unexplained: Revealing Hidden Correlations for Better Interpretability [1.8274323268621635]
Real Explainer(RealExp)は、Shapley値を個々の特徴と特徴相関の重要度に分解する、解釈可能性の手法である。
RealExpは、個々の特徴とそれらの相互作用を正確に定量化することで、解釈可能性を高める。
論文 参考訳(メタデータ) (2024-12-02T10:50:50Z) - A Probabilistic Model Behind Self-Supervised Learning [53.64989127914936]
自己教師付き学習(SSL)では、アノテートラベルなしで補助的なタスクを通じて表現が学習される。
自己教師型学習のための生成潜在変数モデルを提案する。
対照的な方法を含む識別的SSLのいくつかのファミリーは、表現に匹敵する分布を誘導することを示した。
論文 参考訳(メタデータ) (2024-02-02T13:31:17Z) - Recognizing Unseen Objects via Multimodal Intensive Knowledge Graph
Propagation [68.13453771001522]
画像の領域と対応するセマンティック埋め込みとをマッチングする多モード集中型ZSLフレームワークを提案する。
我々は、大規模な実世界のデータに基づいて、広範囲な実験を行い、そのモデルを評価する。
論文 参考訳(メタデータ) (2023-06-14T13:07:48Z) - On the Generalization of Learned Structured Representations [5.1398743023989555]
我々は、その隠された構造を捉えた非構造化データの表現を、ほとんど、あるいは全く監督せずに学習する方法を研究する。
この論文の第2部は、シンボルのような実体の観点で入力の構成構造をキャプチャするオブジェクト中心表現に焦点を当てている。
論文 参考訳(メタデータ) (2023-04-25T17:14:36Z) - Robust and Controllable Object-Centric Learning through Energy-based
Models [95.68748828339059]
我々の研究は概念的にシンプルで一般的なアプローチであり、エネルギーベースモデルを通してオブジェクト中心の表現を学習する。
既存のアーキテクチャに容易に統合でき、高品質なオブジェクト中心表現を効果的に抽出できることを示す。
論文 参考訳(メタデータ) (2022-10-11T15:11:15Z) - On Neural Architecture Inductive Biases for Relational Tasks [76.18938462270503]
合成ネットワーク一般化(CoRelNet)と呼ばれる類似度分布スコアに基づく簡単なアーキテクチャを導入する。
単純なアーキテクチャの選択は、分布外一般化において既存のモデルより優れていることが分かる。
論文 参考訳(メタデータ) (2022-06-09T16:24:01Z) - Self-Supervised Visual Representation Learning with Semantic Grouping [50.14703605659837]
我々は、未ラベルのシーン中心のデータから視覚表現を学習する問題に取り組む。
本研究では,データ駆動型セマンティックスロット,すなわちSlotConによる協調型セマンティックグルーピングと表現学習のためのコントラスト学習を提案する。
論文 参考訳(メタデータ) (2022-05-30T17:50:59Z) - An Empirical Investigation of Representation Learning for Imitation [76.48784376425911]
視覚、強化学習、NLPにおける最近の研究は、補助的な表現学習の目的が、高価なタスク固有の大量のデータの必要性を減らすことを示している。
本稿では,表現学習アルゴリズムを構築するためのモジュラーフレームワークを提案する。
論文 参考訳(メタデータ) (2022-05-16T11:23:42Z) - Object Pursuit: Building a Space of Objects via Discriminative Weight
Generation [23.85039747700698]
視覚学習と理解のためのオブジェクト中心表現を継続的に学習するフレームワークを提案する。
我々は、オブジェクト中心の表現を学習しながら、オブジェクトとそれに対応するトレーニング信号の多様なバリエーションをサンプリングするために、インタラクションを活用する。
提案するフレームワークの重要な特徴について広範な研究を行い,学習した表現の特徴を分析した。
論文 参考訳(メタデータ) (2021-12-15T08:25:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。