論文の概要: DeepKoCo: Efficient latent planning with a task-relevant Koopman
representation
- arxiv url: http://arxiv.org/abs/2011.12690v3
- Date: Fri, 24 Sep 2021 07:16:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-21 02:37:17.176925
- Title: DeepKoCo: Efficient latent planning with a task-relevant Koopman
representation
- Title(参考訳): DeepKoCo:タスク関連Koopman表現による効率的な潜在計画
- Authors: Bas van der Heijden, Laura Ferranti, Jens Kober, Robert Babuska
- Abstract要約: DeepKoCoは、画像から潜伏したクープマン表現を学習する、新しいモデルベースのエージェントである。
従来のエージェントと比較して、DeepKoCoはタスク関連ダイナミクスを学ぶ。
- 参考スコア(独自算出の注目度): 10.79142506437051
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents DeepKoCo, a novel model-based agent that learns a latent
Koopman representation from images. This representation allows DeepKoCo to plan
efficiently using linear control methods, such as linear model predictive
control. Compared to traditional agents, DeepKoCo learns task-relevant
dynamics, thanks to the use of a tailored lossy autoencoder network that allows
DeepKoCo to learn latent dynamics that reconstruct and predict only observed
costs, rather than all observed dynamics. As our results show, DeepKoCo
achieves similar final performance as traditional model-free methods on complex
control tasks while being considerably more robust to distractor dynamics,
making the proposed agent more amenable for real-life applications.
- Abstract(参考訳): 本稿では,画像から潜在するクープマン表現を学習するモデルベースエージェントDeepKoCoを提案する。
この表現により、DeepKoCoは線形モデル予測制御のような線形制御手法を効率的に計画できる。
従来のエージェントと比較して、DeepKoCoはタスク関連ダイナミクスを学習している。DeepKoCoは、観察されたすべてのダイナミクスではなく、観測されたコストのみを再構成し予測する潜時ダイナミクスを学習できる、カスタマイズされたロスコーダネットワークを使用している。
以上の結果から,DeepKoCoは複雑な制御タスクにおける従来のモデルフリー手法と同様の最終的な性能を達成しつつ,動的に注意をそらすような堅牢性を実現し,提案エージェントを現実のアプリケーションに利用しやすくする。
関連論文リスト
- MGDepth: Motion-Guided Cost Volume For Self-Supervised Monocular Depth
In Dynamic Scenarios [47.33082977365344]
MGDepthは、動的オブジェクトと静的背景の両方の正確な深さ推定を実現するために、モーションガイド付きコストボリューム深さネットである。
MGDepthは、KITTI-2015データセット上での自己教師付き単分子深度推定において、ルート平均二乗誤差を約7%削減する。
論文 参考訳(メタデータ) (2023-12-23T14:36:27Z) - Efficient Adaptive Human-Object Interaction Detection with
Concept-guided Memory [64.11870454160614]
概念誘導メモリ(ADA-CM)を用いた適応型HOI検出器を提案する。
ADA-CMには2つの操作モードがある。最初のモードでは、トレーニング不要のパラダイムで新しいパラメータを学習することなくチューニングできる。
提案手法は, HICO-DET と V-COCO のデータセットに対して, より少ないトレーニング時間で, 最新技術による競合的な結果を得る。
論文 参考訳(メタデータ) (2023-09-07T13:10:06Z) - Goal-Conditioned Predictive Coding for Offline Reinforcement Learning [24.300131097275298]
本研究は, シーケンス・モデリングがトラジェクトリを, ポリシー学習を促進する有用な表現に凝縮する能力を持つかどうかを考察する。
本稿では、強力な軌道表現を導出し、実行ポリシーをもたらすシーケンスモデリングの目的であるゴール・コンディション付き予測符号化を紹介する。
論文 参考訳(メタデータ) (2023-07-07T06:12:14Z) - Characterizing the load profile in power grids by Koopman mode
decomposition of interconnected dynamics [0.6629765271909505]
本稿では,データ駆動手法を用いて負荷動態を同定する,解釈可能な機械学習手法を提案する。
我々は、基礎となる力学に固有のクープマン演算子を用いて負荷データを表現している。
ヨーロッパ大陸の電力系統における再生可能電力系統の大規模データセットを用いて,本手法の評価を行った。
論文 参考訳(メタデータ) (2023-04-16T16:56:52Z) - Predictive Experience Replay for Continual Visual Control and
Forecasting [62.06183102362871]
視覚力学モデリングのための新しい連続学習手法を提案し,その視覚制御と予測における有効性について検討する。
まず,タスク固有のダイナミクスをガウスの混合で学習する混合世界モデルを提案し,その上で,破滅的な忘れを克服するための新たなトレーニング戦略を提案する。
我々のモデルは,DeepMind Control と Meta-World のベンチマークにおいて,既存の連続的学習アルゴリズムと視覚的RLアルゴリズムの単純な組み合わせよりも優れている。
論文 参考訳(メタデータ) (2023-03-12T05:08:03Z) - Sample-efficient Reinforcement Learning Representation Learning with
Curiosity Contrastive Forward Dynamics Model [17.41484483119774]
本稿では、CCFDM(Curiosity Contrastive Forward Dynamics Model)の学習フレームワークを検討し、よりサンプル効率の高い強化学習(RL)を実現する。
CCFDMはフォワードダイナミクスモデル(FDM)を導入し、その深層畳み込みニューラルネットワークベースのイメージエンコーダ(IE)をトレーニングするためのコントラスト学習を実行する
トレーニング中、CFDMはFDM予測誤差に基づいて生成された本質的な報酬を提供し、RLエージェントの好奇性を高めて探索を改善する。
論文 参考訳(メタデータ) (2021-03-15T10:08:52Z) - Deep Reinforcement Learning for Combinatorial Optimization: Covering
Salesman Problems [4.692304496312442]
本稿では,カバーセールスマン問題 (CSP) を大まかに解くための新しい深層学習手法を提案する。
このアプローチでは、CSPの都市位置を入力として、ディープニューラルネットワークモデルがソリューションを直接出力するように設計されている。
指導なしに深層強化学習を用いて訓練される。
論文 参考訳(メタデータ) (2021-02-11T07:25:04Z) - Goal-Conditioned End-to-End Visuomotor Control for Versatile Skill
Primitives [89.34229413345541]
本稿では,制御器とその条件をエンドツーエンドに学習することで,落とし穴を回避する条件付け手法を提案する。
本モデルでは,ロボットの動きのダイナミックな画像表現に基づいて,複雑な動作シーケンスを予測する。
代表的MPCおよびILベースラインに対するタスク成功の大幅な改善を報告した。
論文 参考訳(メタデータ) (2020-03-19T15:04:37Z) - Forecasting Sequential Data using Consistent Koopman Autoencoders [52.209416711500005]
クープマン理論に関連する新しい物理学に基づく手法が導入された。
本稿では,既存の作業の多くと異なり,前方・後方のダイナミクスを生かした新しいコンシスタント・クープマン・オートエンコーダモデルを提案する。
このアプローチの鍵となるのは、一貫性のある力学と関連するクープマン作用素との相互作用を探索する新しい解析である。
論文 参考訳(メタデータ) (2020-03-04T18:24:30Z) - Predictive Coding for Locally-Linear Control [92.35650774524399]
高次元観測と未知のダイナミクスは、多くの実世界の意思決定タスクに最適な制御を適用する際に大きな課題である。
Learning Controllable Embedding (LCE)フレームワークは、観測結果を低次元の潜伏空間に埋め込むことによって、これらの課題に対処する。
理論的には、明示的な次観測予測を予測符号化に置き換えることが可能である。
論文 参考訳(メタデータ) (2020-03-02T18:20:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。