論文の概要: DeepKoCo: Efficient latent planning with a task-relevant Koopman
representation
- arxiv url: http://arxiv.org/abs/2011.12690v3
- Date: Fri, 24 Sep 2021 07:16:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-21 02:37:17.176925
- Title: DeepKoCo: Efficient latent planning with a task-relevant Koopman
representation
- Title(参考訳): DeepKoCo:タスク関連Koopman表現による効率的な潜在計画
- Authors: Bas van der Heijden, Laura Ferranti, Jens Kober, Robert Babuska
- Abstract要約: DeepKoCoは、画像から潜伏したクープマン表現を学習する、新しいモデルベースのエージェントである。
従来のエージェントと比較して、DeepKoCoはタスク関連ダイナミクスを学ぶ。
- 参考スコア(独自算出の注目度): 10.79142506437051
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents DeepKoCo, a novel model-based agent that learns a latent
Koopman representation from images. This representation allows DeepKoCo to plan
efficiently using linear control methods, such as linear model predictive
control. Compared to traditional agents, DeepKoCo learns task-relevant
dynamics, thanks to the use of a tailored lossy autoencoder network that allows
DeepKoCo to learn latent dynamics that reconstruct and predict only observed
costs, rather than all observed dynamics. As our results show, DeepKoCo
achieves similar final performance as traditional model-free methods on complex
control tasks while being considerably more robust to distractor dynamics,
making the proposed agent more amenable for real-life applications.
- Abstract(参考訳): 本稿では,画像から潜在するクープマン表現を学習するモデルベースエージェントDeepKoCoを提案する。
この表現により、DeepKoCoは線形モデル予測制御のような線形制御手法を効率的に計画できる。
従来のエージェントと比較して、DeepKoCoはタスク関連ダイナミクスを学習している。DeepKoCoは、観察されたすべてのダイナミクスではなく、観測されたコストのみを再構成し予測する潜時ダイナミクスを学習できる、カスタマイズされたロスコーダネットワークを使用している。
以上の結果から,DeepKoCoは複雑な制御タスクにおける従来のモデルフリー手法と同様の最終的な性能を達成しつつ,動的に注意をそらすような堅牢性を実現し,提案エージェントを現実のアプリケーションに利用しやすくする。
関連論文リスト
- Deep Learning for Koopman Operator Estimation in Idealized Atmospheric Dynamics [2.2489531925874013]
ディープラーニングは、気象予報に革命をもたらしており、新しいデータ駆動モデルは、中期予測のための運用物理モデルと同等の精度を達成している。
これらのモデルは解釈可能性に欠けることが多く、基礎となる力学を理解するのが難しく、説明が難しい。
本稿では、データ駆動モデルの透明性を高めるために、複雑な非線形力学の線形表現を提供するクープマン作用素を推定する手法を提案する。
論文 参考訳(メタデータ) (2024-09-10T13:56:54Z) - Deep Companion Learning: Enhancing Generalization Through Historical Consistency [35.5237083057451]
本稿では,不整合モデル予測をペナライズすることによって一般化を促進するディープニューラルネットワーク(DNN)の新たなトレーニング手法を提案する。
我々は、新しい入力の予測を提供するために、以前のバージョンのモデルを用いて、ディープコンパニオンモデル(DCM)を訓練する。
このコンパニオンモデルは、データ内の有意義な潜在意味構造を解読し、ターゲットの監視を提供する。
論文 参考訳(メタデータ) (2024-07-26T15:31:13Z) - Jointly Training and Pruning CNNs via Learnable Agent Guidance and Alignment [69.33930972652594]
本稿では,CNNモデルの重みと構造的プーン構造を協調的に学習するための新しい構造的プルーニング手法を提案する。
本手法の中核となる要素は強化学習(RL)エージェントであり,その動作がCNNモデルの階層のプルーニング比を決定する。
我々は,モデルの重みとエージェントのポリシーを反復的に訓練し,共同訓練と刈り取りを行う。
論文 参考訳(メタデータ) (2024-03-28T15:22:29Z) - Self-STORM: Deep Unrolled Self-Supervised Learning for Super-Resolution Microscopy [55.2480439325792]
我々は、シーケンス固有のモデルベースのオートエンコーダをトレーニングすることで、そのようなデータの必要性を軽減する、深層無学習の自己教師付き学習を導入する。
提案手法は, 監視対象の性能を超過する。
論文 参考訳(メタデータ) (2024-03-25T17:40:32Z) - Temporally-Consistent Koopman Autoencoders for Forecasting Dynamical Systems [42.6886113798806]
テンポラリ一貫性を有するクープマンオートエンコーダ(tcKAE)について紹介する。
tcKAEは、制約付き、ノイズの多いトレーニングデータであっても正確な長期予測を生成する。
我々は,最先端のKAEモデルよりもtcKAEの方が,様々なテストケースで優れた性能を示す。
論文 参考訳(メタデータ) (2024-03-19T00:48:25Z) - Efficient Adaptive Human-Object Interaction Detection with
Concept-guided Memory [64.11870454160614]
概念誘導メモリ(ADA-CM)を用いた適応型HOI検出器を提案する。
ADA-CMには2つの操作モードがある。最初のモードでは、トレーニング不要のパラダイムで新しいパラメータを学習することなくチューニングできる。
提案手法は, HICO-DET と V-COCO のデータセットに対して, より少ないトレーニング時間で, 最新技術による競合的な結果を得る。
論文 参考訳(メタデータ) (2023-09-07T13:10:06Z) - Characterizing the load profile in power grids by Koopman mode
decomposition of interconnected dynamics [0.6629765271909505]
本稿では,データ駆動手法を用いて負荷動態を同定する,解釈可能な機械学習手法を提案する。
我々は、基礎となる力学に固有のクープマン演算子を用いて負荷データを表現している。
ヨーロッパ大陸の電力系統における再生可能電力系統の大規模データセットを用いて,本手法の評価を行った。
論文 参考訳(メタデータ) (2023-04-16T16:56:52Z) - Predictive Experience Replay for Continual Visual Control and
Forecasting [62.06183102362871]
視覚力学モデリングのための新しい連続学習手法を提案し,その視覚制御と予測における有効性について検討する。
まず,タスク固有のダイナミクスをガウスの混合で学習する混合世界モデルを提案し,その上で,破滅的な忘れを克服するための新たなトレーニング戦略を提案する。
我々のモデルは,DeepMind Control と Meta-World のベンチマークにおいて,既存の連続的学習アルゴリズムと視覚的RLアルゴリズムの単純な組み合わせよりも優れている。
論文 参考訳(メタデータ) (2023-03-12T05:08:03Z) - Deep Reinforcement Learning for Combinatorial Optimization: Covering
Salesman Problems [4.692304496312442]
本稿では,カバーセールスマン問題 (CSP) を大まかに解くための新しい深層学習手法を提案する。
このアプローチでは、CSPの都市位置を入力として、ディープニューラルネットワークモデルがソリューションを直接出力するように設計されている。
指導なしに深層強化学習を用いて訓練される。
論文 参考訳(メタデータ) (2021-02-11T07:25:04Z) - Forecasting Sequential Data using Consistent Koopman Autoencoders [52.209416711500005]
クープマン理論に関連する新しい物理学に基づく手法が導入された。
本稿では,既存の作業の多くと異なり,前方・後方のダイナミクスを生かした新しいコンシスタント・クープマン・オートエンコーダモデルを提案する。
このアプローチの鍵となるのは、一貫性のある力学と関連するクープマン作用素との相互作用を探索する新しい解析である。
論文 参考訳(メタデータ) (2020-03-04T18:24:30Z) - Predictive Coding for Locally-Linear Control [92.35650774524399]
高次元観測と未知のダイナミクスは、多くの実世界の意思決定タスクに最適な制御を適用する際に大きな課題である。
Learning Controllable Embedding (LCE)フレームワークは、観測結果を低次元の潜伏空間に埋め込むことによって、これらの課題に対処する。
理論的には、明示的な次観測予測を予測符号化に置き換えることが可能である。
論文 参考訳(メタデータ) (2020-03-02T18:20:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。