論文の概要: GEM: Group Enhanced Model for Learning Dynamical Control Systems
- arxiv url: http://arxiv.org/abs/2104.02844v1
- Date: Wed, 7 Apr 2021 01:08:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-09 01:29:57.700686
- Title: GEM: Group Enhanced Model for Learning Dynamical Control Systems
- Title(参考訳): GEM:動的制御系学習のためのグループ強化モデル
- Authors: Philippe Hansen-Estruch, Wenling Shang, Lerrel Pinto, Pieter Abbeel,
Stas Tiomkin
- Abstract要約: サンプルベースの学習が可能な効果的なダイナミクスモデルを構築します。
リー代数ベクトル空間上のダイナミクスの学習は、直接状態遷移モデルを学ぶよりも効果的であることを示す。
この研究は、ダイナミクスの学習とリー群の性質の関連性を明らかにし、新たな研究の方向への扉を開く。
- 参考スコア(独自算出の注目度): 78.56159072162103
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning the dynamics of a physical system wherein an autonomous agent
operates is an important task. Often these systems present apparent geometric
structures. For instance, the trajectories of a robotic manipulator can be
broken down into a collection of its transitional and rotational motions, fully
characterized by the corresponding Lie groups and Lie algebras. In this work,
we take advantage of these structures to build effective dynamical models that
are amenable to sample-based learning. We hypothesize that learning the
dynamics on a Lie algebra vector space is more effective than learning a direct
state transition model. To verify this hypothesis, we introduce the Group
Enhanced Model (GEM). GEMs significantly outperform conventional transition
models on tasks of long-term prediction, planning, and model-based
reinforcement learning across a diverse suite of standard continuous-control
environments, including Walker, Hopper, Reacher, Half-Cheetah, Inverted
Pendulums, Ant, and Humanoid. Furthermore, plugging GEM into existing state of
the art systems enhances their performance, which we demonstrate on the PETS
system. This work sheds light on a connection between learning of dynamics and
Lie group properties, which opens doors for new research directions and
practical applications along this direction. Our code is publicly available at:
https://tinyurl.com/GEMMBRL.
- Abstract(参考訳): 自律エージェントが動作する物理システムのダイナミクスを学ぶことは重要なタスクである。
しばしばこれらの系は明らかな幾何学的構造を示す。
例えば、ロボットマニピュレータの軌道は、その遷移運動と回転運動の集合に分解され、対応するリー群とリー代数によって完全に特徴づけられる。
本研究では,これらの構造を利用して,サンプルベース学習に適した効果的な動的モデルを構築する。
リー代数ベクトル空間上でのダイナミクスの学習は、直接状態遷移モデルを学ぶよりも有効であると仮定する。
この仮説を検証するために,グループ拡張モデル(GEM)を提案する。
GEMは、Walker、Hopper、Reacher、Half-Cheetah、Inverted Pendulums、Ant、Humanoidなど、さまざまな標準の継続的制御環境における長期予測、計画、モデルに基づく強化学習のタスクにおいて、従来の移行モデルよりも大幅に優れている。
さらに,GEMを既存の技術システムに接続することで,その性能が向上し,PETSシステムで実演する。
この研究は、ダイナミクスの学習とリー群の性質との関係に光を当て、この方向に沿って新しい研究の方向性と実践的な応用の扉を開く。
私たちのコードは、https://tinyurl.com/GEMMBRL.comで公開されています。
関連論文リスト
- Learning System Dynamics without Forgetting [60.08612207170659]
未知の力学を持つ系の軌道予測は、物理学や生物学を含む様々な研究分野において重要である。
本稿では,モードスイッチンググラフODE (MS-GODE) の新たなフレームワークを提案する。
生体力学の異なる多様な系を特徴とする生体力学システムの新しいベンチマークを構築した。
論文 参考訳(メタデータ) (2024-06-30T14:55:18Z) - Learning spatio-temporal patterns with Neural Cellular Automata [0.0]
我々はNAAを訓練し、時系列画像とPDE軌道から複雑な力学を学ぶ。
我々はNCAを拡張し、同じシステム内の過渡構造と安定構造の両方を捕捉する。
任意のダイナミクスを学べることによって、NAAはデータ駆動モデリングフレームワークとして大きな可能性を秘めている。
論文 参考訳(メタデータ) (2023-10-23T11:16:32Z) - PASTA: Pretrained Action-State Transformer Agents [10.654719072766495]
自己教師型学習は、様々なコンピューティング領域において革命的なパラダイムシフトをもたらした。
最近のアプローチでは、大量のラベルのないデータに基づいて、トランスフォーマーモデルを事前訓練する。
強化学習において、研究者は最近これらのアプローチに適応し、専門家の軌道で事前訓練されたモデルを開発した。
論文 参考訳(メタデータ) (2023-07-20T15:09:06Z) - Physics-Inspired Temporal Learning of Quadrotor Dynamics for Accurate
Model Predictive Trajectory Tracking [76.27433308688592]
クオーロタのシステムダイナミクスを正確にモデル化することは、アジャイル、安全、安定したナビゲーションを保証する上で非常に重要です。
本稿では,ロボットの経験から,四重項系の力学を純粋に学習するための新しい物理インスパイアされた時間畳み込みネットワーク(PI-TCN)を提案する。
提案手法は,スパース時間的畳み込みと高密度フィードフォワード接続の表現力を組み合わせて,正確なシステム予測を行う。
論文 参考訳(メタデータ) (2022-06-07T13:51:35Z) - Which priors matter? Benchmarking models for learning latent dynamics [70.88999063639146]
古典力学の先行概念を機械学習モデルに統合する手法が提案されている。
これらのモデルの現在の機能について、精査する。
連続的および時間的可逆的ダイナミクスの使用は、すべてのクラスのモデルに恩恵をもたらす。
論文 参考訳(メタデータ) (2021-11-09T23:48:21Z) - An Adaptable Approach to Learn Realistic Legged Locomotion without
Examples [38.81854337592694]
本研究は,バネ装荷逆振り子モデルを用いて学習プロセスを導くことで,移動における現実性を保証するための汎用的アプローチを提案する。
モデルのない設定であっても、2足歩行ロボットと4足歩行ロボットに対して、学習したポリシーが現実的でエネルギー効率のよい移動歩行を生成できることを示す実験結果を示す。
論文 参考訳(メタデータ) (2021-10-28T10:14:47Z) - Trajectory-wise Multiple Choice Learning for Dynamics Generalization in
Reinforcement Learning [137.39196753245105]
本稿では,動的一般化のためのマルチヘッドダイナミックスモデルを学習するモデルベース強化学習アルゴリズムを提案する。
文脈学習は,過去の経験から得られる動的情報からコンテキスト潜在ベクトルにエンコードする。
提案手法は,最先端のRL法と比較して,様々な制御タスクにおいて優れたゼロショット一般化性能を示す。
論文 参考訳(メタデータ) (2020-10-26T03:20:42Z) - CLOUD: Contrastive Learning of Unsupervised Dynamics [19.091886595825947]
コントラスト推定により、完全に教師のない方法で前方・逆ダイナミクスを学習することを提案する。
目標指向計画や観察からの模倣など,さまざまなタスクにまたがるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2020-10-23T15:42:57Z) - Continual Model-Based Reinforcement Learning with Hypernetworks [24.86684067407964]
本稿では,タスク条件付きハイパーネットを用いたタスクのシーケンスにおいて,遭遇するダイナミクスを継続的に学習する手法を提案する。
まず、従来のタスクからトレーニングデータを再考しない動的学習セッションを含むので、状態遷移経験の最新の固定サイズの部分を格納するだけです。
ロボットの移動と操作のシナリオにおいて,HyperCRLは連続モデルに基づく強化学習に有効であることを示す。
論文 参考訳(メタデータ) (2020-09-25T01:46:26Z) - S2RMs: Spatially Structured Recurrent Modules [105.0377129434636]
モジュール構造とテンポラル構造の両方を同時に活用できる動的構造を利用するための一歩を踏み出します。
我々のモデルは利用可能なビューの数に対して堅牢であり、追加のトレーニングなしで新しいタスクに一般化できる。
論文 参考訳(メタデータ) (2020-07-13T17:44:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。