論文の概要: Learning Reactive and Predictive Differentiable Controllers for
Switching Linear Dynamical Models
- arxiv url: http://arxiv.org/abs/2103.14256v1
- Date: Fri, 26 Mar 2021 04:40:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-29 12:52:52.994988
- Title: Learning Reactive and Predictive Differentiable Controllers for
Switching Linear Dynamical Models
- Title(参考訳): 線形力学モデルのスイッチングのためのリアクティブおよび予測微分可能コントローラの学習
- Authors: Saumya Saxena, Alex LaGrassa, Oliver Kroemer
- Abstract要約: 専門家による実証から複合ダイナミクス行動を学習するためのフレームワークを提示する。
システムダイナミクスの近接近似としてスイッチング条件にエンコードされた接点を持つスイッチング線形ダイナミクスモデルを学ぶ。
次に、データ効率のよい制御学習のための微分可能なポリシークラスとして離散時間LQRを使用し、制御戦略を開発する。
- 参考スコア(独自算出の注目度): 7.653542219337937
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Humans leverage the dynamics of the environment and their own bodies to
accomplish challenging tasks such as grasping an object while walking past it
or pushing off a wall to turn a corner. Such tasks often involve switching
dynamics as the robot makes and breaks contact. Learning these dynamics is a
challenging problem and prone to model inaccuracies, especially near contact
regions. In this work, we present a framework for learning composite dynamical
behaviors from expert demonstrations. We learn a switching linear dynamical
model with contacts encoded in switching conditions as a close approximation of
our system dynamics. We then use discrete-time LQR as the differentiable policy
class for data-efficient learning of control to develop a control strategy that
operates over multiple dynamical modes and takes into account discontinuities
due to contact. In addition to predicting interactions with the environment,
our policy effectively reacts to inaccurate predictions such as unanticipated
contacts. Through simulation and real world experiments, we demonstrate
generalization of learned behaviors to different scenarios and robustness to
model inaccuracies during execution.
- Abstract(参考訳): 人間は環境とその身体のダイナミクスを活用して、物体を通り過ぎながらつかむことや、壁を外して角を曲がるといった課題を達成する。
このようなタスクは、ロボットが接触をしたり壊したりする際に、動的に切り替える。
これらのダイナミクスを学ぶことは難しい問題であり、特に接触領域の近くで不正確さをモデル化する傾向があります。
本研究では,専門家による実演から複合動的行動を学ぶための枠組みを提案する。
スイッチング条件にエンコードされた接触を持つスイッチング線形力学モデルについて,システムダイナミクスの近似として学習する。
次に、離散時間lqrをデータ効率のよい制御学習のための微分可能なポリシークラスとして使用し、複数の動的モード上で動作し、接触による不連続を考慮した制御戦略を開発する。
環境との相互作用を予測することに加えて,予期しない接触などの不正確な予測にも効果的に反応する。
シミュレーションと実世界実験を通じて,異なるシナリオへの学習行動の一般化と,実行中の不正確性をモデル化するための頑健性を示す。
関連論文リスト
- Learning System Dynamics without Forgetting [60.08612207170659]
未知の力学を持つ系の軌道予測は、物理学や生物学を含む様々な研究分野において重要である。
本稿では,モードスイッチンググラフODE (MS-GODE) の新たなフレームワークを提案する。
生体力学の異なる多様な系を特徴とする生体力学システムの新しいベンチマークを構築した。
論文 参考訳(メタデータ) (2024-06-30T14:55:18Z) - Model-Based Reinforcement Learning with Isolated Imaginations [61.67183143982074]
モデルに基づく強化学習手法であるIso-Dream++を提案する。
我々は、切り離された潜在的想像力に基づいて政策最適化を行う。
これにより、野生の混合力学源を孤立させることで、長い水平振動子制御タスクの恩恵を受けることができる。
論文 参考訳(メタデータ) (2023-03-27T02:55:56Z) - Predictive Experience Replay for Continual Visual Control and
Forecasting [62.06183102362871]
視覚力学モデリングのための新しい連続学習手法を提案し,その視覚制御と予測における有効性について検討する。
まず,タスク固有のダイナミクスをガウスの混合で学習する混合世界モデルを提案し,その上で,破滅的な忘れを克服するための新たなトレーニング戦略を提案する。
我々のモデルは,DeepMind Control と Meta-World のベンチマークにおいて,既存の連続的学習アルゴリズムと視覚的RLアルゴリズムの単純な組み合わせよりも優れている。
論文 参考訳(メタデータ) (2023-03-12T05:08:03Z) - Active Learning of Discrete-Time Dynamics for Uncertainty-Aware Model Predictive Control [46.81433026280051]
本稿では,非線形ロボットシステムの力学を積極的にモデル化する自己教師型学習手法を提案する。
我々のアプローチは、目に見えない飛行条件に一貫して適応することで、高いレジリエンスと一般化能力を示す。
論文 参考訳(メタデータ) (2022-10-23T00:45:05Z) - Time Will Change Things: An Empirical Study on Dynamic Language
Understanding in Social Media Classification [5.075802830306718]
我々は、実験的にソーシャルメディアのNLUを動的に研究し、モデルが過去のデータに基づいてトレーニングされ、将来のテストが行われる。
自動エンコーディングと擬似ラベルが協調して、動的性の最良の堅牢性を示すことを示す。
論文 参考訳(メタデータ) (2022-10-06T12:18:28Z) - Dynamic Modeling of Hand-Object Interactions via Tactile Sensing [133.52375730875696]
本研究では,高分解能な触覚グローブを用いて,多種多様な物体に対して4種類のインタラクティブな動作を行う。
我々は,クロスモーダル学習フレームワーク上にモデルを構築し,視覚処理パイプラインを用いてラベルを生成し,触覚モデルを監督する。
この研究は、高密度触覚センシングによる手動物体相互作用における動的モデリングの一歩を踏み出す。
論文 参考訳(メタデータ) (2021-09-09T16:04:14Z) - GEM: Group Enhanced Model for Learning Dynamical Control Systems [78.56159072162103]
サンプルベースの学習が可能な効果的なダイナミクスモデルを構築します。
リー代数ベクトル空間上のダイナミクスの学習は、直接状態遷移モデルを学ぶよりも効果的であることを示す。
この研究は、ダイナミクスの学習とリー群の性質の関連性を明らかにし、新たな研究の方向への扉を開く。
論文 参考訳(メタデータ) (2021-04-07T01:08:18Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z) - CLOUD: Contrastive Learning of Unsupervised Dynamics [19.091886595825947]
コントラスト推定により、完全に教師のない方法で前方・逆ダイナミクスを学習することを提案する。
目標指向計画や観察からの模倣など,さまざまなタスクにまたがるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2020-10-23T15:42:57Z) - ContactNets: Learning Discontinuous Contact Dynamics with Smooth,
Implicit Representations [4.8986598953553555]
本手法は,物体間符号距離と接触フレームジャコビアンのパラメータ化を学習する。
提案手法は,60秒間の実世界のデータを用いて,現実的な影響,非ペネティフィケーション,スティクションを予測できる。
論文 参考訳(メタデータ) (2020-09-23T14:51:08Z) - ADAIL: Adaptive Adversarial Imitation Learning [11.270858993502705]
本稿では,動的に変化する環境間で伝達可能な適応型ポリシーを学習するための適応型適応型適応模倣学習(ADAIL)アルゴリズムを提案する。
これはロボット学習において重要な問題であり,1)報酬関数の取得が困難であること,2)ドメイン統計を対象とするさまざまなソースによる学習方針の展開が困難であること,3)動的に知られ制御される複数の環境における専門家によるデモンストレーションの収集が不可能であること,などが挙げられる。
論文 参考訳(メタデータ) (2020-08-23T06:11:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。