論文の概要: DeepKoCo: Efficient latent planning with a task-relevant Koopman
representation
- arxiv url: http://arxiv.org/abs/2011.12690v3
- Date: Fri, 24 Sep 2021 07:16:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-21 02:37:17.176925
- Title: DeepKoCo: Efficient latent planning with a task-relevant Koopman
representation
- Title(参考訳): DeepKoCo:タスク関連Koopman表現による効率的な潜在計画
- Authors: Bas van der Heijden, Laura Ferranti, Jens Kober, Robert Babuska
- Abstract要約: DeepKoCoは、画像から潜伏したクープマン表現を学習する、新しいモデルベースのエージェントである。
従来のエージェントと比較して、DeepKoCoはタスク関連ダイナミクスを学ぶ。
- 参考スコア(独自算出の注目度): 10.79142506437051
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents DeepKoCo, a novel model-based agent that learns a latent
Koopman representation from images. This representation allows DeepKoCo to plan
efficiently using linear control methods, such as linear model predictive
control. Compared to traditional agents, DeepKoCo learns task-relevant
dynamics, thanks to the use of a tailored lossy autoencoder network that allows
DeepKoCo to learn latent dynamics that reconstruct and predict only observed
costs, rather than all observed dynamics. As our results show, DeepKoCo
achieves similar final performance as traditional model-free methods on complex
control tasks while being considerably more robust to distractor dynamics,
making the proposed agent more amenable for real-life applications.
- Abstract(参考訳): 本稿では,画像から潜在するクープマン表現を学習するモデルベースエージェントDeepKoCoを提案する。
この表現により、DeepKoCoは線形モデル予測制御のような線形制御手法を効率的に計画できる。
従来のエージェントと比較して、DeepKoCoはタスク関連ダイナミクスを学習している。DeepKoCoは、観察されたすべてのダイナミクスではなく、観測されたコストのみを再構成し予測する潜時ダイナミクスを学習できる、カスタマイズされたロスコーダネットワークを使用している。
以上の結果から,DeepKoCoは複雑な制御タスクにおける従来のモデルフリー手法と同様の最終的な性能を達成しつつ,動的に注意をそらすような堅牢性を実現し,提案エージェントを現実のアプリケーションに利用しやすくする。
関連論文リスト
- Active Data Curation Effectively Distills Large-Scale Multimodal Models [66.23057263509027]
知識蒸留(KD)は、大規模モデルをより小さなものに圧縮するデファクトスタンダードである。
本研究では, 対照的なマルチモーダル事前学習のための効果的な蒸留法として, 能動的データキュレーションの代替として, 簡単なアプローチを探求する。
我々の単純なオンラインバッチ選択方法であるACIDは、さまざまなモデル、データ、計算構成において、強力なKDベースラインよりも優れています。
論文 参考訳(メタデータ) (2024-11-27T18:50:15Z) - Deep Learning for Koopman Operator Estimation in Idealized Atmospheric Dynamics [2.2489531925874013]
ディープラーニングは、気象予報に革命をもたらしており、新しいデータ駆動モデルは、中期予測のための運用物理モデルと同等の精度を達成している。
これらのモデルは解釈可能性に欠けることが多く、基礎となる力学を理解するのが難しく、説明が難しい。
本稿では、データ駆動モデルの透明性を高めるために、複雑な非線形力学の線形表現を提供するクープマン作用素を推定する手法を提案する。
論文 参考訳(メタデータ) (2024-09-10T13:56:54Z) - Deep Companion Learning: Enhancing Generalization Through Historical Consistency [35.5237083057451]
本稿では,不整合モデル予測をペナライズすることによって一般化を促進するディープニューラルネットワーク(DNN)の新たなトレーニング手法を提案する。
我々は、新しい入力の予測を提供するために、以前のバージョンのモデルを用いて、ディープコンパニオンモデル(DCM)を訓練する。
このコンパニオンモデルは、データ内の有意義な潜在意味構造を解読し、ターゲットの監視を提供する。
論文 参考訳(メタデータ) (2024-07-26T15:31:13Z) - Jointly Training and Pruning CNNs via Learnable Agent Guidance and Alignment [69.33930972652594]
本稿では,CNNモデルの重みと構造的プーン構造を協調的に学習するための新しい構造的プルーニング手法を提案する。
本手法の中核となる要素は強化学習(RL)エージェントであり,その動作がCNNモデルの階層のプルーニング比を決定する。
我々は,モデルの重みとエージェントのポリシーを反復的に訓練し,共同訓練と刈り取りを行う。
論文 参考訳(メタデータ) (2024-03-28T15:22:29Z) - Temporally-Consistent Koopman Autoencoders for Forecasting Dynamical Systems [38.36312939874359]
テンポラリ一貫性を有するクープマンオートエンコーダ(tcKAE)について紹介する。
tcKAEは、限られたノイズの多いトレーニングデータであっても、正確な長期予測を生成する。
我々は,最先端のKAEモデルよりもtcKAEの方が,様々なテストケースで優れた性能を示す。
論文 参考訳(メタデータ) (2024-03-19T00:48:25Z) - Efficient Adaptive Human-Object Interaction Detection with
Concept-guided Memory [64.11870454160614]
概念誘導メモリ(ADA-CM)を用いた適応型HOI検出器を提案する。
ADA-CMには2つの操作モードがある。最初のモードでは、トレーニング不要のパラダイムで新しいパラメータを学習することなくチューニングできる。
提案手法は, HICO-DET と V-COCO のデータセットに対して, より少ないトレーニング時間で, 最新技術による競合的な結果を得る。
論文 参考訳(メタデータ) (2023-09-07T13:10:06Z) - An Interpretable Approach to Load Profile Forecasting in Power Grids using Galerkin-Approximated Koopman Pseudospectra [0.3160121582090025]
本稿では,電力網における電力予測のための演算子理論フレームワーク内の力学を特徴付ける解釈可能な機械学習手法を提案する。
非線形力学の線形無限次元表現を提供するクープマン演算子を用いて負荷データの動的表現を行う。
本手法は,季節変化による時間的コヒーレントなパターンと,日時や日時といったより詳細な時間スケールを捉える。
論文 参考訳(メタデータ) (2023-04-16T16:56:52Z) - Predictive Experience Replay for Continual Visual Control and
Forecasting [62.06183102362871]
視覚力学モデリングのための新しい連続学習手法を提案し,その視覚制御と予測における有効性について検討する。
まず,タスク固有のダイナミクスをガウスの混合で学習する混合世界モデルを提案し,その上で,破滅的な忘れを克服するための新たなトレーニング戦略を提案する。
我々のモデルは,DeepMind Control と Meta-World のベンチマークにおいて,既存の連続的学習アルゴリズムと視覚的RLアルゴリズムの単純な組み合わせよりも優れている。
論文 参考訳(メタデータ) (2023-03-12T05:08:03Z) - Deep Reinforcement Learning for Combinatorial Optimization: Covering
Salesman Problems [4.692304496312442]
本稿では,カバーセールスマン問題 (CSP) を大まかに解くための新しい深層学習手法を提案する。
このアプローチでは、CSPの都市位置を入力として、ディープニューラルネットワークモデルがソリューションを直接出力するように設計されている。
指導なしに深層強化学習を用いて訓練される。
論文 参考訳(メタデータ) (2021-02-11T07:25:04Z) - Forecasting Sequential Data using Consistent Koopman Autoencoders [52.209416711500005]
クープマン理論に関連する新しい物理学に基づく手法が導入された。
本稿では,既存の作業の多くと異なり,前方・後方のダイナミクスを生かした新しいコンシスタント・クープマン・オートエンコーダモデルを提案する。
このアプローチの鍵となるのは、一貫性のある力学と関連するクープマン作用素との相互作用を探索する新しい解析である。
論文 参考訳(メタデータ) (2020-03-04T18:24:30Z) - Predictive Coding for Locally-Linear Control [92.35650774524399]
高次元観測と未知のダイナミクスは、多くの実世界の意思決定タスクに最適な制御を適用する際に大きな課題である。
Learning Controllable Embedding (LCE)フレームワークは、観測結果を低次元の潜伏空間に埋め込むことによって、これらの課題に対処する。
理論的には、明示的な次観測予測を予測符号化に置き換えることが可能である。
論文 参考訳(メタデータ) (2020-03-02T18:20:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。