論文の概要: Planning from Images with Deep Latent Gaussian Process Dynamics
- arxiv url: http://arxiv.org/abs/2005.03770v1
- Date: Thu, 7 May 2020 21:29:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 22:20:16.250590
- Title: Planning from Images with Deep Latent Gaussian Process Dynamics
- Title(参考訳): 潜伏ガウス過程ダイナミクスを用いた画像からの計画
- Authors: Nathanael Bosch, Jan Achterhold, Laura Leal-Taix\'e, J\"org St\"uckler
- Abstract要約: 計画は既知の環境力学の問題を制御するための強力なアプローチである。
未知の環境では、エージェントは計画を適用するためにシステムダイナミクスのモデルを学ぶ必要がある。
本稿では,環境と視覚的相互作用から低次元システムダイナミクスを学習する,遅延ガウス過程力学(DLGPD)モデルを提案する。
- 参考スコア(独自算出の注目度): 2.924868086534434
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Planning is a powerful approach to control problems with known environment
dynamics. In unknown environments the agent needs to learn a model of the
system dynamics to make planning applicable. This is particularly challenging
when the underlying states are only indirectly observable through images. We
propose to learn a deep latent Gaussian process dynamics (DLGPD) model that
learns low-dimensional system dynamics from environment interactions with
visual observations. The method infers latent state representations from
observations using neural networks and models the system dynamics in the
learned latent space with Gaussian processes. All parts of the model can be
trained jointly by optimizing a lower bound on the likelihood of transitions in
image space. We evaluate the proposed approach on the pendulum swing-up task
while using the learned dynamics model for planning in latent space in order to
solve the control problem. We also demonstrate that our method can quickly
adapt a trained agent to changes in the system dynamics from just a few
rollouts. We compare our approach to a state-of-the-art purely deep learning
based method and demonstrate the advantages of combining Gaussian processes
with deep learning for data efficiency and transfer learning.
- Abstract(参考訳): 計画は既知の環境力学の問題を制御するための強力なアプローチである。
未知の環境では、エージェントは計画を適用するためにシステムダイナミクスのモデルを学ぶ必要がある。
基礎となる状態が画像を通して間接的にしか観測できない場合、これは特に困難である。
本研究では,環境相互作用と視覚観察から低次元システムダイナミクスを学習する,潜伏ガウス過程ダイナミクス(dlgpd)モデルを提案する。
この方法は、ニューラルネットワークを用いた観測から潜時状態表現を推論し、ガウス過程を用いて学習された潜時空間の系力学をモデル化する。
モデルのすべての部分は、画像空間の遷移の可能性の低い境界を最適化することで、共同で訓練することができる。
制御問題を解くために,学習された動的モデルを用いて潜在空間を計画する際の振り子発振タスクに対する提案手法の評価を行った。
また,本手法では,ほんの数回のロールアウトからシステムダイナミクスの変化に対して,トレーニングエージェントを迅速に適用できることを実証する。
本手法を最先端の純粋深層学習法と比較し,ガウス過程と深層学習を組み合わせたデータ効率とトランスファー学習の利点を示す。
関連論文リスト
- Learning System Dynamics without Forgetting [60.08612207170659]
未知の力学を持つ系の軌道予測は、物理学や生物学を含む様々な研究分野において重要である。
本稿では,モードスイッチンググラフODE (MS-GODE) の新たなフレームワークを提案する。
生体力学の異なる多様な系を特徴とする生体力学システムの新しいベンチマークを構築した。
論文 参考訳(メタデータ) (2024-06-30T14:55:18Z) - Learning visual-based deformable object rearrangement with local graph
neural networks [4.333220038316982]
本稿では,変形可能なオブジェクト状態とキーポイントの集合とその相互作用を効率的にモデル化できる新しい表現戦略を提案する。
また、変形可能な再配置ダイナミクスを共同でモデル化し、最適操作動作を推定するための光局所GNN学習を提案する。
本手法は, 各種変形可能なアレンジメントタスク(平均96.3%)において, シミュレーション実験における最先端手法よりもはるかに高い成功率を達成する。
論文 参考訳(メタデータ) (2023-10-16T11:42:54Z) - Predictive Experience Replay for Continual Visual Control and
Forecasting [62.06183102362871]
視覚力学モデリングのための新しい連続学習手法を提案し,その視覚制御と予測における有効性について検討する。
まず,タスク固有のダイナミクスをガウスの混合で学習する混合世界モデルを提案し,その上で,破滅的な忘れを克服するための新たなトレーニング戦略を提案する。
我々のモデルは,DeepMind Control と Meta-World のベンチマークにおいて,既存の連続的学習アルゴリズムと視覚的RLアルゴリズムの単純な組み合わせよりも優れている。
論文 参考訳(メタデータ) (2023-03-12T05:08:03Z) - ConCerNet: A Contrastive Learning Based Framework for Automated
Conservation Law Discovery and Trustworthy Dynamical System Prediction [82.81767856234956]
本稿では,DNNに基づく動的モデリングの信頼性を向上させるために,ConCerNetという新しい学習フレームワークを提案する。
本手法は, 座標誤差と保存量の両方において, ベースラインニューラルネットワークよりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2023-02-11T21:07:30Z) - Decomposed Linear Dynamical Systems (dLDS) for learning the latent
components of neural dynamics [6.829711787905569]
本稿では,時系列データの非定常および非線形の複雑なダイナミクスを表現した新しい分解力学系モデルを提案する。
我々のモデルは辞書学習によって訓練され、最近の結果を利用してスパースベクトルを時間とともに追跡する。
連続時間と離散時間の両方の指導例において、我々のモデルは元のシステムによく近似できることを示した。
論文 参考訳(メタデータ) (2022-06-07T02:25:38Z) - Gradient-Based Trajectory Optimization With Learned Dynamics [80.41791191022139]
データからシステムの微分可能なダイナミクスモデルを学習するために、機械学習技術を使用します。
ニューラルネットワークは、大規模な時間的地平線に対して、非常に非線形な振る舞いを正確にモデル化できることが示される。
ハードウェア実験において、学習したモデルがSpotとRadio- controlled (RC)の両方の複雑な力学を表現できることを実証した。
論文 参考訳(メタデータ) (2022-04-09T22:07:34Z) - Dream to Explore: Adaptive Simulations for Autonomous Systems [3.0664963196464448]
ベイズ的非パラメトリック法を適用し,力学系制御の学習に挑戦する。
ガウス過程を用いて潜在世界力学を探索することにより、強化学習で観測される一般的なデータ効率の問題を緩和する。
本アルゴリズムは,ログの変動的下界を最適化することにより,世界モデルと政策を共同で学習する。
論文 参考訳(メタデータ) (2021-10-27T04:27:28Z) - LQResNet: A Deep Neural Network Architecture for Learning Dynamic
Processes [9.36739413306697]
データ駆動型アプローチ、すなわちオペレータ推論フレームワークは、動的プロセスをモデル化する。
演算子推論と特定のディープニューラルネットワークアプローチを組み合わせることで、システムの未知の非線形ダイナミクスを推定することを提案する。
論文 参考訳(メタデータ) (2021-03-03T08:19:43Z) - Sample-efficient reinforcement learning using deep Gaussian processes [18.044018772331636]
強化学習(Reinforcement learning)は、試行錯誤を通じてタスクを完了するためのアクションを制御するためのフレームワークを提供する。
モデルに基づく強化学習効率は、世界力学をシミュレートする学習によって改善される。
合成の深さがモデル複雑性をもたらすのに対して、ダイナミックスに関する事前の知識を取り入れることで、滑らかさと構造がもたらされる、深いガウス過程を導入する。
論文 参考訳(メタデータ) (2020-11-02T13:37:57Z) - Localized active learning of Gaussian process state space models [63.97366815968177]
多くの共通制御アプリケーションにおいて、優れた性能を達成するためには、グローバルに正確なモデルを必要としない。
本稿では,状態-作用空間の有界部分集合上の正確なモデルを得ることを目的としたガウス過程状態空間モデルに対する能動的学習戦略を提案する。
モデル予測制御を用いることで、探索中に収集した情報を統合し、探索戦略を適応的に改善する。
論文 参考訳(メタデータ) (2020-05-04T05:35:02Z) - Learning Stable Deep Dynamics Models [91.90131512825504]
状態空間全体にわたって安定することが保証される力学系を学習するためのアプローチを提案する。
このような学習システムは、単純な力学系をモデル化することができ、複雑な力学を学習するために追加の深層生成モデルと組み合わせることができることを示す。
論文 参考訳(メタデータ) (2020-01-17T00:04:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。