論文の概要: Structured Policy Representation: Imposing Stability in arbitrarily
conditioned dynamic systems
- arxiv url: http://arxiv.org/abs/2012.06224v1
- Date: Fri, 11 Dec 2020 10:11:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-11 02:51:09.355988
- Title: Structured Policy Representation: Imposing Stability in arbitrarily
conditioned dynamic systems
- Title(参考訳): 構造化政策表現:任意条件付き動的システムにおける安定性
- Authors: Julen Urain, Davide Tateo, Tianyu Ren, Jan Peters
- Abstract要約: 我々は、ディープニューラルネットワークベースの動的システムの新しいファミリーを提示する。
提示されたダイナミクスはグローバルに安定しており、任意のコンテキストステートでコンディションすることができる。
これらのダイナミクスを構造化ロボットのポリシーとして利用できることを示す。
- 参考スコア(独自算出の注目度): 24.11609722217645
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a new family of deep neural network-based dynamic systems. The
presented dynamics are globally stable and can be conditioned with an arbitrary
context state. We show how these dynamics can be used as structured robot
policies. Global stability is one of the most important and straightforward
inductive biases as it allows us to impose reasonable behaviors outside the
region of the demonstrations.
- Abstract(参考訳): 我々は、ディープニューラルネットワークベースの動的システムの新しいファミリーを提示する。
提示されたダイナミクスはグローバルに安定しており、任意のコンテキスト状態で条件付けすることができる。
これらのダイナミクスを構造化ロボットのポリシーとして利用できることを示す。
グローバルな安定性は、デモンストレーションの領域外で合理的な行動を課すことができるため、最も重要で直接的な帰納的バイアスの1つです。
関連論文リスト
- Learning Deep Dissipative Dynamics [5.862431328401459]
分散性は、安定性と入出力安定性を一般化する力学系にとって重要な指標である。
本稿では,ニューラルネットワークで表現される任意のダイナミクスを散逸型プロジェクションに変換する微分可能プロジェクションを提案する。
本手法は, 訓練された力学系の安定性, 入力出力安定性, エネルギー保存を厳密に保証する。
論文 参考訳(メタデータ) (2024-08-21T09:44:43Z) - Stability-Certified Learning of Control Systems with Quadratic
Nonlinearities [9.599029891108229]
この研究は、主に低次元の力学モデルを構築することを目的とした演算子推論手法に焦点を当てている。
本研究の目的は,本質的な安定性を保証する2次制御力学系の推論を容易にする手法を開発することである。
論文 参考訳(メタデータ) (2024-03-01T16:26:47Z) - Neural Contractive Dynamical Systems [13.046426079291376]
完全自律型ロボットが望ましくない、あるいは潜在的に有害な行動を起こさないためには、安定性の保証が不可欠である。
本稿では,ニューラルアーキテクチャが収縮を保証するニューラル収縮力学系を学習するための新しい手法を提案する。
提案手法は, 現状技術よりも所望の力学を正確に符号化し, 安定性の保証がより少ないことを示す。
論文 参考訳(メタデータ) (2024-01-17T17:18:21Z) - End-to-End Stable Imitation Learning via Autonomous Neural Dynamic
Policies [2.7941001040182765]
State-of-the-the-art Sensorimotor Learningアルゴリズムは、不安定な振る舞いをしばしば生成できるポリシーを提供する。
従来のロボット学習は、安定性と安全性を解析できる動的システムベースのポリシーに依存している。
本研究では,汎用ニューラルネットワークポリシと動的システムベースのポリシのギャップを埋める。
論文 参考訳(メタデータ) (2023-05-22T10:10:23Z) - Isolating and Leveraging Controllable and Noncontrollable Visual
Dynamics in World Models [65.97707691164558]
Iso-DreamはDream-to-Controlフレームワークを2つの側面で改善する。
まず、逆動力学を最適化することにより、世界モデルに制御可能で制御不能な情報源を学習させることを奨励する。
第2に、エージェントの挙動を世界モデルの切り離された潜在的想像力に最適化する。
論文 参考訳(メタデータ) (2022-05-27T08:07:39Z) - Hierarchical Neural Dynamic Policies [50.969565411919376]
我々は,高次元画像入力から学習しながら,実世界の動的タスクの非表示構成への一般化の課題に取り組む。
階層型ニューラル・ダイナミック・ポリシー(H-NDP)と呼ばれる階層型ディープ・ポリシー・ラーニング・フレームワークを用いる。
H-NDPは、状態空間の小さな領域における局所力学系に基づくポリシーを学習することでカリキュラムを形成する。
我々は,H-NDPが模倣と強化学習の双方と容易に統合され,最先端の成果が得られることを示した。
論文 参考訳(メタデータ) (2021-07-12T17:59:58Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z) - Euclideanizing Flows: Diffeomorphic Reduction for Learning Stable
Dynamical Systems [74.80320120264459]
本研究では、限られた数の人間の実演からそのような動きを学ぶためのアプローチを提案する。
複素運動は安定な力学系のロールアウトとして符号化される。
このアプローチの有効性は、確立されたベンチマーク上での検証と、現実世界のロボットシステム上で収集されたデモによって実証される。
論文 参考訳(メタデータ) (2020-05-27T03:51:57Z) - Context-aware Dynamics Model for Generalization in Model-Based
Reinforcement Learning [124.9856253431878]
グローバルなダイナミクスモデルを学習するタスクを,(a)ローカルなダイナミクスをキャプチャするコンテキスト潜在ベクトルを学習し,(b)次に条件付き状態を予測するという2つの段階に分割する。
本研究では,コンテキスト潜在ベクトルに動的情報をエンコードするために,コンテキスト潜在ベクトルを前方と後方の両方のダイナミクスを予測するのに役立つような新しい損失関数を導入する。
提案手法は,既存のRL方式と比較して,様々なシミュレーションロボットや制御タスクの一般化能力に優れる。
論文 参考訳(メタデータ) (2020-05-14T08:10:54Z) - Learning Stable Deep Dynamics Models [91.90131512825504]
状態空間全体にわたって安定することが保証される力学系を学習するためのアプローチを提案する。
このような学習システムは、単純な力学系をモデル化することができ、複雑な力学を学習するために追加の深層生成モデルと組み合わせることができることを示す。
論文 参考訳(メタデータ) (2020-01-17T00:04:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。