論文の概要: Investigating Simple Object Representations in Model-Free Deep
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2002.06703v2
- Date: Thu, 28 May 2020 22:00:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-31 17:31:45.103397
- Title: Investigating Simple Object Representations in Model-Free Deep
Reinforcement Learning
- Title(参考訳): モデルフリー深層強化学習における単純物体表現の検討
- Authors: Guy Davidson, Brenden M. Lake
- Abstract要約: 我々は、シンプルなオブジェクト表現を用いた最先端のモデルフリーディープ強化アルゴリズムの利点を探求する。
Atari 2600のFrostbiteゲームでは,Rainbowモデルにシンプルな特徴工学的オブジェクト表現を提供することで,性能が大幅に向上することがわかった。
次に、異なる種類のオブジェクトの表現の相対的寄与を分析し、これらの表現が最も影響のある環境状態を特定し、これらの表現が新しい状況への一般化にどのように役立つかを検討する。
- 参考スコア(独自算出の注目度): 21.574781022415365
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We explore the benefits of augmenting state-of-the-art model-free deep
reinforcement algorithms with simple object representations. Following the
Frostbite challenge posited by Lake et al. (2017), we identify object
representations as a critical cognitive capacity lacking from current
reinforcement learning agents. We discover that providing the Rainbow model
(Hessel et al.,2018) with simple, feature-engineered object representations
substantially boosts its performance on the Frostbite game from Atari 2600. We
then analyze the relative contributions of the representations of different
types of objects, identify environment states where these representations are
most impactful, and examine how these representations aid in generalizing to
novel situations.
- Abstract(参考訳): 我々は、シンプルなオブジェクト表現を用いた最先端のモデルフリーディープ強化アルゴリズムの利点を探求する。
Lake et al. (2017) によるFrostbite チャレンジに続き、対象表現を現在の強化学習エージェントに欠ける重要な認知能力として認識する。
我々は,Rainbowモデル(Hessel et al.,2018)にシンプルな特徴工学的オブジェクト表現を提供することで,Atari 2600のFrostbiteゲームの性能を大幅に向上させることを発見した。
次に、異なる種類のオブジェクトの表現の相対的寄与を分析し、これらの表現が最も影響のある環境状態を特定し、これらの表現が新しい状況への一般化にどのように役立つかを検討する。
関連論文リスト
- Zero-Shot Object-Centric Representation Learning [72.43369950684057]
ゼロショット一般化のレンズによる現在の対象中心法について検討する。
8つの異なる合成および実世界のデータセットからなるベンチマークを導入する。
多様な実世界の画像のトレーニングにより、見えないシナリオへの転送性が向上することがわかった。
論文 参考訳(メタデータ) (2024-08-17T10:37:07Z) - Cycle Consistency Driven Object Discovery [75.60399804639403]
本研究では,シーンの各オブジェクトが異なるスロットに関連付けられなければならない制約を明示的に最適化する手法を提案する。
これらの一貫性目標を既存のスロットベースのオブジェクト中心手法に統合することにより、オブジェクト発見性能を大幅に改善することを示す。
提案手法は,オブジェクト発見を改善するだけでなく,下流タスクのよりリッチな機能も提供することを示唆している。
論文 参考訳(メタデータ) (2023-06-03T21:49:06Z) - Sparse Relational Reasoning with Object-Centric Representations [78.83747601814669]
対象中心表現の操作において,リレーショナルニューラルアーキテクチャによって学習されたソフトルールの構成可能性について検討する。
特に特徴量の増加は,いくつかのモデルの性能を向上し,より単純な関係をもたらすことが判明した。
論文 参考訳(メタデータ) (2022-07-15T14:57:33Z) - An Empirical Investigation of Representation Learning for Imitation [76.48784376425911]
視覚、強化学習、NLPにおける最近の研究は、補助的な表現学習の目的が、高価なタスク固有の大量のデータの必要性を減らすことを示している。
本稿では,表現学習アルゴリズムを構築するためのモジュラーフレームワークを提案する。
論文 参考訳(メタデータ) (2022-05-16T11:23:42Z) - Investigating the Properties of Neural Network Representations in
Reinforcement Learning [35.02223992335008]
本稿では,強化学習における伝達を支援する表現の特性を実証的に検討する。
我々は、画素ベースのナビゲーション環境において、補助的損失が異なる深層Q学習エージェントについて検討する。
そこで我々は,ある表現が転送に適する理由を,体系的なアプローチでよりよく理解する手法を開発した。
論文 参考訳(メタデータ) (2022-03-30T00:14:26Z) - Object Pursuit: Building a Space of Objects via Discriminative Weight
Generation [23.85039747700698]
視覚学習と理解のためのオブジェクト中心表現を継続的に学習するフレームワークを提案する。
我々は、オブジェクト中心の表現を学習しながら、オブジェクトとそれに対応するトレーニング信号の多様なバリエーションをサンプリングするために、インタラクションを活用する。
提案するフレームワークの重要な特徴について広範な研究を行い,学習した表現の特徴を分析した。
論文 参考訳(メタデータ) (2021-12-15T08:25:30Z) - Constellation: Learning relational abstractions over objects for
compositional imagination [64.99658940906917]
静的な視覚シーンのリレーショナル抽象化を学習するネットワークであるConstellationを紹介する。
この研究は、視覚的関係を明確に表現し、それらを複雑な認知手続きに使用するための第一歩である。
論文 参考訳(メタデータ) (2021-07-23T11:59:40Z) - Self-Supervised Representation Learning from Flow Equivariance [97.13056332559526]
本稿では,複雑なシーンの映像ストリームに直接展開可能な,自己教師型学習表現フレームワークを提案する。
高分解能rawビデオから学んだ我々の表現は、静的画像の下流タスクに簡単に使用できます。
論文 参考訳(メタデータ) (2021-01-16T23:44:09Z) - Reconstruction Bottlenecks in Object-Centric Generative Models [24.430685026986524]
近年のVAEモデルであるgenESISにおけるシーン分解における「再構成ボトルネック」の役割について検討する。
このようなボトルネックが再構成やセグメンテーションの質を決定づけ、モデル行動に重大な影響を及ぼすことを示す。
論文 参考訳(メタデータ) (2020-07-13T08:52:48Z) - Relevance-Guided Modeling of Object Dynamics for Reinforcement Learning [0.0951828574518325]
現在の深層強化学習(RL)アプローチでは、環境に関する最小限の事前知識が組み込まれている。
本稿では,最小限およびタスク固有のオブジェクト表現を迅速に決定するために,オブジェクトのダイナミクスと振る舞いを推論するフレームワークを提案する。
また、オブジェクト表現と標準RLと計画アルゴリズムを用いて、Atariゲームにおけるこのフレームワークの可能性を強調し、既存の深層RLアルゴリズムよりも劇的に高速に学習する。
論文 参考訳(メタデータ) (2020-03-03T08:18:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。