論文の概要: Mutual Information Maximization for Robust Plannable Representations
- arxiv url: http://arxiv.org/abs/2005.08114v1
- Date: Sat, 16 May 2020 21:58:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-02 12:39:45.858798
- Title: Mutual Information Maximization for Robust Plannable Representations
- Title(参考訳): ロバスト平面表現のための相互情報の最大化
- Authors: Yiming Ding, Ignasi Clavera, Pieter Abbeel
- Abstract要約: モデルに基づく強化学習のための情報理論表現学習アルゴリズムMIROを提案する。
提案手法は, 邪魔や散らかったシーンの存在下で, 再建目的よりも頑健であることを示す。
- 参考スコア(独自算出の注目度): 82.83676853746742
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Extending the capabilities of robotics to real-world complex, unstructured
environments requires the need of developing better perception systems while
maintaining low sample complexity. When dealing with high-dimensional state
spaces, current methods are either model-free or model-based based on
reconstruction objectives. The sample inefficiency of the former constitutes a
major barrier for applying them to the real-world. The later, while they
present low sample complexity, they learn latent spaces that need to
reconstruct every single detail of the scene. In real environments, the task
typically just represents a small fraction of the scene. Reconstruction
objectives suffer in such scenarios as they capture all the unnecessary
components. In this work, we present MIRO, an information theoretic
representational learning algorithm for model-based reinforcement learning. We
design a latent space that maximizes the mutual information with the future
information while being able to capture all the information needed for
planning. We show that our approach is more robust than reconstruction
objectives in the presence of distractors and cluttered scenes
- Abstract(参考訳): ロボット工学の能力を現実世界の複雑な非構造環境に拡張するには、低いサンプルの複雑さを維持しながら、より良い知覚システムを開発する必要がある。
高次元状態空間を扱う場合、現在の手法はモデルフリーまたはモデルベースのいずれかである。
前者のサンプルの非効率性は、実世界に適用するための大きな障壁となる。
その後、サンプルの複雑さが低くなる一方で、シーンのすべての詳細を再構築する必要がある潜在空間を学習する。
実際の環境では、タスクは通常、シーンのごく一部を表すだけである。
レコンストラクションの目的は、不要なコンポーネントをすべてキャプチャするといったシナリオに苦しむ。
本研究では,モデルに基づく強化学習のための情報理論表現学習アルゴリズムMIROを提案する。
我々は,計画に必要な情報をすべて把握しながら,将来の情報と相互情報を最大化する潜在空間を設計する。
我々のアプローチは、邪魔者や散らかったシーンの存在下での再構築目標よりも堅牢であることを示す。
関連論文リスト
- Flex: End-to-End Text-Instructed Visual Navigation with Foundation Models [59.892436892964376]
本稿では,視覚に基づく制御ポリシを用いて,ロバストな閉ループ性能を実現するために必要な最小限のデータ要件とアーキテクチャ適応について検討する。
この知見はFlex (Fly-lexically) で合成され,VLM(Vision Language Models) をフリーズしたパッチワイド特徴抽出器として利用するフレームワークである。
本研究では,本手法が4段階のフライ・トゥ・ターゲットタスクにおいて有効であることを示す。
論文 参考訳(メタデータ) (2024-10-16T19:59:31Z) - Reusable Architecture Growth for Continual Stereo Matching [92.36221737921274]
我々は、教師付きおよび自己監督型の両方で、新しいシーンを継続的に学習するための、再利用可能なアーキテクチャ成長(RAG)フレームワークを紹介します。
RAGは、前のユニットを再利用し、良好な性能を得ることにより、成長中の高い再利用性を維持することができる。
また、推論時にシーン固有のアーキテクチャパスを適応的に選択するScene Routerモジュールを提案する。
論文 参考訳(メタデータ) (2024-03-30T13:24:58Z) - Learning with a Mole: Transferable latent spatial representations for
navigation without reconstruction [12.845774297648736]
ほとんどのエンドツーエンドの学習アプローチでは、表現は潜伏しており、通常は明確に定義された解釈を持っていない。
本研究では,目的とする下流タスクとは無関係にシーンの動作可能な表現を学習することを提案する。
学習された表現は、進路から分岐する複数の短いエピソードをナビゲートするように訓練された盲人補助エージェントによって最適化される。
論文 参考訳(メタデータ) (2023-06-06T16:51:43Z) - Bridging the Gap to Real-World Object-Centric Learning [66.55867830853803]
自己教師付き方法で訓練されたモデルから特徴を再構成することは、完全に教師なしの方法でオブジェクト中心表現が生じるための十分な訓練信号であることを示す。
我々のアプローチであるDINOSAURは、シミュレーションデータ上で既存のオブジェクト中心学習モデルよりも大幅に優れています。
論文 参考訳(メタデータ) (2022-09-29T15:24:47Z) - Curious Exploration via Structured World Models Yields Zero-Shot Object
Manipulation [19.840186443344]
そこで本研究では,制御ループに帰納バイアスを組み込む構造的世界モデルを用いて,サンプル効率の高い探索を実現することを提案する。
提案手法は,早期にオブジェクトと対話し始める自由プレイ動作を生成し,時間とともにより複雑な動作を発達させる。
論文 参考訳(メタデータ) (2022-06-22T22:08:50Z) - Information-Theoretic Odometry Learning [83.36195426897768]
生体計測推定を目的とした学習動機付け手法のための統合情報理論フレームワークを提案する。
提案フレームワークは情報理論言語の性能評価と理解のためのエレガントなツールを提供する。
論文 参考訳(メタデータ) (2022-03-11T02:37:35Z) - Temporal Predictive Coding For Model-Based Planning In Latent Space [80.99554006174093]
時間的に予測可能な環境要素を符号化するために,時間的予測符号化を用いた情報理論的手法を提案する。
本稿では,DMControl タスクの背景を複雑な情報を含む自然なビデオに置き換える,標準的な DMControl タスクの挑戦的な修正について評価する。
論文 参考訳(メタデータ) (2021-06-14T04:31:15Z) - On the Transfer of Disentangled Representations in Realistic Settings [44.367245337475445]
1Mのシミュレーション画像と1,800以上の注釈付き実世界の画像を備えた新しい高解像度データセットを導入する。
本研究では,非交叉表現学習を現実的な高解像度設定に拡張するために,新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-10-27T16:15:24Z) - Learning Neural-Symbolic Descriptive Planning Models via Cube-Space
Priors: The Voyage Home (to STRIPS) [13.141761152863868]
我々のニューロシンボリックアーキテクチャは、画像のみから簡潔で効果的な離散状態遷移モデルを生成するために、エンドツーエンドで訓練されていることを示す。
私たちのターゲット表現は、既成の問題解決者が使いこなせる形で既に存在しており、現代の検索機能への扉を開いています。
論文 参考訳(メタデータ) (2020-04-27T15:01:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。