論文の概要: Hierarchical Decomposition of Nonlinear Dynamics and Control for System
Identification and Policy Distillation
- arxiv url: http://arxiv.org/abs/2005.01432v2
- Date: Tue, 12 May 2020 14:54:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-07 00:10:36.398352
- Title: Hierarchical Decomposition of Nonlinear Dynamics and Control for System
Identification and Policy Distillation
- Title(参考訳): 非線形ダイナミクスの階層的分解とシステム同定と政策蒸留の制御
- Authors: Hany Abdulsamad and Jan Peters
- Abstract要約: 強化学習(RL)の最近のトレンドは、力学と政策の複雑な表現に焦点を当てている。
制御コミュニティからインスピレーションを得て、複雑なダイナミクスをより単純なコンポーネントに分解するために、ハイブリッドスイッチングシステムの原則を適用します。
- 参考スコア(独自算出の注目度): 39.83837705993256
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The control of nonlinear dynamical systems remains a major challenge for
autonomous agents. Current trends in reinforcement learning (RL) focus on
complex representations of dynamics and policies, which have yielded impressive
results in solving a variety of hard control tasks. However, this new
sophistication and extremely over-parameterized models have come with the cost
of an overall reduction in our ability to interpret the resulting policies. In
this paper, we take inspiration from the control community and apply the
principles of hybrid switching systems in order to break down complex dynamics
into simpler components. We exploit the rich representational power of
probabilistic graphical models and derive an expectation-maximization (EM)
algorithm for learning a sequence model to capture the temporal structure of
the data and automatically decompose nonlinear dynamics into stochastic
switching linear dynamical systems. Moreover, we show how this framework of
switching models enables extracting hierarchies of Markovian and
auto-regressive locally linear controllers from nonlinear experts in an
imitation learning scenario.
- Abstract(参考訳): 非線形力学系の制御は、自律エージェントにとって大きな課題である。
強化学習(RL)の最近のトレンドは、力学とポリシーの複雑な表現に焦点を当てており、様々なハードコントロールタスクの解決に顕著な結果をもたらしている。
しかし、この新しい高度化と極めて過度にパラメータ化されたモデルは、その結果のポリシーを解釈する能力の全体的な削減のコストを伴っている。
本稿では,制御コミュニティから着想を得て,複雑なダイナミクスをより単純なコンポーネントに分解するために,ハイブリッドスイッチングシステムの原則を適用する。
本研究では,確率的グラフィカルモデルの豊かな表現力を活用し,シーケンスモデルを学習してデータの時間構造を把握し,非線形力学を確率スイッチング線形力学系に自動的に分解する予測最大化(EM)アルゴリズムを導出する。
さらに,このスイッチングモデルにより,非線型専門家からマルコフ型および自己回帰型局所線形コントローラの階層構造を模倣学習シナリオで抽出できることを示す。
関連論文リスト
- Learning System Dynamics without Forgetting [60.08612207170659]
未知の力学を持つ系の軌道予測は、物理学や生物学を含む様々な研究分野において重要である。
本稿では,モードスイッチンググラフODE (MS-GODE) の新たなフレームワークを提案する。
生体力学の異なる多様な系を特徴とする生体力学システムの新しいベンチマークを構築した。
論文 参考訳(メタデータ) (2024-06-30T14:55:18Z) - Data driven modeling for self-similar dynamics [1.0790314700764785]
本稿では,自己相似性を先行知識として組み込んだマルチスケールニューラルネットワークフレームワークを提案する。
決定論的ダイナミクスの場合、我々のフレームワークは力学が自己相似かどうかを識別できる。
本手法は,自己相似システムにおける電力法指数を同定する。
論文 参考訳(メタデータ) (2023-10-12T12:39:08Z) - Decomposed Linear Dynamical Systems (dLDS) for learning the latent
components of neural dynamics [6.829711787905569]
本稿では,時系列データの非定常および非線形の複雑なダイナミクスを表現した新しい分解力学系モデルを提案する。
我々のモデルは辞書学習によって訓練され、最近の結果を利用してスパースベクトルを時間とともに追跡する。
連続時間と離散時間の両方の指導例において、我々のモデルは元のシステムによく近似できることを示した。
論文 参考訳(メタデータ) (2022-06-07T02:25:38Z) - Capturing Actionable Dynamics with Structured Latent Ordinary
Differential Equations [68.62843292346813]
本稿では,その潜在表現内でのシステム入力の変動をキャプチャする構造付き潜在ODEモデルを提案する。
静的変数仕様に基づいて,本モデルではシステムへの入力毎の変動要因を学習し,潜在空間におけるシステム入力の影響を分離する。
論文 参考訳(メタデータ) (2022-02-25T20:00:56Z) - Model-Based Reinforcement Learning via Stochastic Hybrid Models [39.83837705993256]
本稿では非線形モデリングと制御のハイブリッドシステムビューを採用する。
本稿では,データの時間的構造を捉えるシーケンスモデリングパラダイムについて考察する。
これらの時系列モデルは,ローカルフィードバックコントローラの抽出に使用するクローズドループ拡張を自然に認めていることを示す。
論文 参考訳(メタデータ) (2021-11-11T14:05:46Z) - Reduced Order Dynamical Models For Complex Dynamics in Manufacturing and
Natural Systems Using Machine Learning [0.0]
この研究は、機械学習(ML)アプローチを用いて製造と自然システムの低次モデルを開発する。
本手法はダイズ油からダイズ油までのプロセスプラントと湖沼システムで実証された。
以上の結果から, プロセスプラントの高精度線形ODEモデルを同定し, 基礎となる線形化学量測定機構と力学を駆動する質量収支を考察した。
論文 参考訳(メタデータ) (2021-10-15T18:44:27Z) - Supervised DKRC with Images for Offline System Identification [77.34726150561087]
現代の力学系はますます非線形で複雑なものになりつつある。
予測と制御のためのコンパクトで包括的な表現でこれらのシステムをモデル化するフレームワークが必要である。
本手法は,教師付き学習手法を用いてこれらの基礎関数を学習する。
論文 参考訳(メタデータ) (2021-09-06T04:39:06Z) - A purely data-driven framework for prediction, optimization, and control
of networked processes: application to networked SIS epidemic model [0.8287206589886881]
我々は,大規模ネットワーク上での非線形力学の同定と制御を行う演算子理論に基づくデータ駆動型フレームワークを開発した。
提案手法では、ネットワーク構造に関する事前の知識は必要とせず、状態の2段階のスナップショットのみを用いて基礎となるダイナミクスを識別する。
論文 参考訳(メタデータ) (2021-08-01T03:57:10Z) - Controlling nonlinear dynamical systems into arbitrary states using
machine learning [77.34726150561087]
機械学習(ML)を活用した,新しい完全データ駆動制御方式を提案する。
最近開発されたMLに基づく複雑なシステムの予測機能により、非線形系は任意の初期状態から来る任意の動的対象状態に留まることが証明された。
必要なデータ量が少なく,柔軟性の高いコントロールスキームを備えることで,工学から医学まで幅広い応用の可能性について簡単に議論する。
論文 参考訳(メタデータ) (2021-02-23T16:58:26Z) - Learning Stable Deep Dynamics Models [91.90131512825504]
状態空間全体にわたって安定することが保証される力学系を学習するためのアプローチを提案する。
このような学習システムは、単純な力学系をモデル化することができ、複雑な力学を学習するために追加の深層生成モデルと組み合わせることができることを示す。
論文 参考訳(メタデータ) (2020-01-17T00:04:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。