論文の概要: Learn Proportional Derivative Controllable Latent Space from Pixels
- arxiv url: http://arxiv.org/abs/2110.08239v1
- Date: Fri, 15 Oct 2021 17:47:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-18 15:41:17.485095
- Title: Learn Proportional Derivative Controllable Latent Space from Pixels
- Title(参考訳): ピクセルから比例微分制御可能な潜在空間を学ぶ
- Authors: Weiyao Wang, Marin Kobilarov and Gregory D. Hager
- Abstract要約: 本稿では,学習された潜在空間が比例微分制御可能であることを強制するために,新たな学習目標を導入することを提案する。
実行時には、単純なPDコントローラを画素から符号化された潜時空間に直接適用して、シンプルで効率的な制御を行うことができる。
- 参考スコア(独自算出の注目度): 29.951834120368094
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in latent space dynamics model from pixels show promising
progress in vision-based model predictive control (MPC). However, executing MPC
in real time can be challenging due to its intensive computational cost in each
timestep. We propose to introduce additional learning objectives to enforce
that the learned latent space is proportional derivative controllable. In
execution time, the simple PD-controller can be applied directly to the latent
space encoded from pixels, to produce simple and effective control to systems
with visual observations. We show that our method outperforms baseline methods
to produce robust goal reaching and trajectory tracking in various
environments.
- Abstract(参考訳): 近年の画素からの潜時空間力学モデルの進歩は,視覚ベースモデル予測制御(MPC)の進歩を期待できる。
しかしながら、mpcをリアルタイムに実行するには、各時間ステップの計算コストが集中するため、難しい場合がある。
学習された潜在空間が比例微分制御可能であることを強制するために、追加の学習目標を導入することを提案する。
実行時、単純なpdコントローラはピクセルから符号化された潜在空間に直接適用でき、視覚観察のあるシステムに対してシンプルで効果的な制御ができる。
提案手法は,様々な環境においてロバストな目標到達および軌道追跡を実現するためのベースライン手法に勝ることを示す。
関連論文リスト
- Predictive Experience Replay for Continual Visual Control and
Forecasting [62.06183102362871]
視覚力学モデリングのための新しい連続学習手法を提案し,その視覚制御と予測における有効性について検討する。
まず,タスク固有のダイナミクスをガウスの混合で学習する混合世界モデルを提案し,その上で,破滅的な忘れを克服するための新たなトレーニング戦略を提案する。
我々のモデルは,DeepMind Control と Meta-World のベンチマークにおいて,既存の連続的学習アルゴリズムと視覚的RLアルゴリズムの単純な組み合わせよりも優れている。
論文 参考訳(メタデータ) (2023-03-12T05:08:03Z) - In-Distribution Barrier Functions: Self-Supervised Policy Filters that
Avoid Out-of-Distribution States [84.24300005271185]
本稿では,任意の参照ポリシーをラップした制御フィルタを提案する。
本手法は、トップダウンとエゴセントリックの両方のビュー設定を含むシミュレーション環境における2つの異なるビズモータ制御タスクに有効である。
論文 参考訳(メタデータ) (2023-01-27T22:28:19Z) - Model-Based Reinforcement Learning via Latent-Space Collocation [110.04005442935828]
我々は、行動だけでなく、状態の順序を計画することで、長期的タスクの解決がより容易であると主張する。
我々は、学習された潜在状態空間モデルを利用して、画像に基づく設定に最適な制御文献における長い水平タスクに対する良い結果を示すコロケーションの概念を適応させる。
論文 参考訳(メタデータ) (2021-06-24T17:59:18Z) - Vision-Based Autonomous Drone Control using Supervised Learning in
Simulation [0.0]
室内環境におけるMAVの自律的ナビゲーションと着陸にSupervised Learningを用いた視覚に基づく制御手法を提案する。
我々は、低解像度画像とセンサー入力を高レベル制御コマンドにマッピングする畳み込みニューラルネットワーク(CNN)を訓練した。
我々のアプローチは、類似の強化学習アプローチよりも短いトレーニング時間を必要としており、匹敵するSupervised Learningアプローチが直面する手動データ収集の限界を克服する可能性がある。
論文 参考訳(メタデータ) (2020-09-09T13:45:41Z) - Online Reinforcement Learning Control by Direct Heuristic Dynamic
Programming: from Time-Driven to Event-Driven [80.94390916562179]
時間駆動学習は、新しいデータが到着すると予測モデルのパラメータを継続的に更新する機械学習手法を指す。
ノイズなどの重要なシステムイベントによる時間駆動型dHDPの更新を防止することが望ましい。
イベント駆動型dHDPアルゴリズムは,従来の時間駆動型dHDPと比較して動作することを示す。
論文 参考訳(メタデータ) (2020-06-16T05:51:25Z) - NewtonianVAE: Proportional Control and Goal Identification from Pixels
via Physical Latent Spaces [9.711378389037812]
本稿では,潜在空間における比例制御性を誘導するために一意に設計された潜在動的学習フレームワークを提案する。
学習したダイナミックスモデルは画素からの比例制御を可能にし、視覚ベースのコントローラの動作クローンを劇的に単純化し、高速化し、実演からのスイッチングコントローラの模倣学習に適用した場合に、解釈可能なゴール発見を提供する。
論文 参考訳(メタデータ) (2020-06-02T21:41:38Z) - Approximate Inverse Reinforcement Learning from Vision-based Imitation
Learning [34.5366377122507]
視覚に基づくナビゲーションのための暗黙的客観関数を求める手法を提案する。
提案手法は, シミュレーション学習, モデル予測制御(MPC), 深層ニューラルネットワークにおける解釈手法に依存する。
論文 参考訳(メタデータ) (2020-04-17T03:36:50Z) - Goal-Conditioned End-to-End Visuomotor Control for Versatile Skill
Primitives [89.34229413345541]
本稿では,制御器とその条件をエンドツーエンドに学習することで,落とし穴を回避する条件付け手法を提案する。
本モデルでは,ロボットの動きのダイナミックな画像表現に基づいて,複雑な動作シーケンスを予測する。
代表的MPCおよびILベースラインに対するタスク成功の大幅な改善を報告した。
論文 参考訳(メタデータ) (2020-03-19T15:04:37Z) - Predictive Coding for Locally-Linear Control [92.35650774524399]
高次元観測と未知のダイナミクスは、多くの実世界の意思決定タスクに最適な制御を適用する際に大きな課題である。
Learning Controllable Embedding (LCE)フレームワークは、観測結果を低次元の潜伏空間に埋め込むことによって、これらの課題に対処する。
理論的には、明示的な次観測予測を予測符号化に置き換えることが可能である。
論文 参考訳(メタデータ) (2020-03-02T18:20:41Z) - Aggressive Perception-Aware Navigation using Deep Optical Flow Dynamics
and PixelMPC [21.81438321320149]
我々は,光学フローとロボットダイナミクスを組み合わせた深部光学フロー(DOF)ダイナミクスを導入する。
DOFダイナミクスを用いて、MPCはロボットの計画軌跡に関連画素の予測運動を明示的に組み込む。
DOFの実装はメモリ効率が良く、データ効率が良く、計算コストも安いので、MPCフレームワークでリアルタイムに計算することができる。
論文 参考訳(メタデータ) (2020-01-07T22:33:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。