論文の概要: Gradient-Based Trajectory Optimization With Learned Dynamics
- arxiv url: http://arxiv.org/abs/2204.04558v3
- Date: Sun, 25 Jun 2023 16:40:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-28 01:29:09.715214
- Title: Gradient-Based Trajectory Optimization With Learned Dynamics
- Title(参考訳): 学習ダイナミクスを用いた勾配に基づく軌道最適化
- Authors: Bhavya Sukhija, Nathanael K\"ohler, Miguel Zamora, Simon Zimmermann,
Sebastian Curi, Andreas Krause, Stelian Coros
- Abstract要約: データからシステムの微分可能なダイナミクスモデルを学習するために、機械学習技術を使用します。
ニューラルネットワークは、大規模な時間的地平線に対して、非常に非線形な振る舞いを正確にモデル化できることが示される。
ハードウェア実験において、学習したモデルがSpotとRadio- controlled (RC)の両方の複雑な力学を表現できることを実証した。
- 参考スコア(独自算出の注目度): 80.41791191022139
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Trajectory optimization methods have achieved an exceptional level of
performance on real-world robots in recent years. These methods heavily rely on
accurate analytical models of the dynamics, yet some aspects of the physical
world can only be captured to a limited extent. An alternative approach is to
leverage machine learning techniques to learn a differentiable dynamics model
of the system from data. In this work, we use trajectory optimization and model
learning for performing highly dynamic and complex tasks with robotic systems
in absence of accurate analytical models of the dynamics. We show that a neural
network can model highly nonlinear behaviors accurately for large time
horizons, from data collected in only 25 minutes of interactions on two
distinct robots: (i) the Boston Dynamics Spot and an (ii) RC car. Furthermore,
we use the gradients of the neural network to perform gradient-based trajectory
optimization. In our hardware experiments, we demonstrate that our learned
model can represent complex dynamics for both the Spot and Radio-controlled
(RC) car, and gives good performance in combination with trajectory
optimization methods.
- Abstract(参考訳): 近年,軌道最適化手法は現実世界のロボットに対して極めて高い性能を達成している。
これらの手法は力学の正確な解析モデルに大きく依存しているが、物理世界のいくつかの側面は限られた範囲でしか捉えられない。
もうひとつのアプローチは、機械学習技術を活用して、データからシステムの微分可能なダイナミクスモデルを学ぶことだ。
本研究では,ロボットシステムによる高ダイナミックかつ複雑なタスクを,正確な解析モデルがない場合に,軌道最適化とモデル学習を用いて行う。
ニューラルネットワークは、2つの異なるロボット上で25分間のインタラクションで収集されたデータから、非常に非線形な振る舞いを大規模地平線に対して正確にモデル化できることを示す。
(i)ボストン・ダイナミクス・スポットとan
(ii)rc車。
さらに,勾配に基づく軌道最適化を行うために,ニューラルネットワークの勾配を用いる。
私たちのハードウェア実験では、学習したモデルはspotとradio- controlled (rc)の両方で複雑なダイナミクスを表現でき、軌道最適化法と組み合わせて優れた性能が得られることを実証した。
関連論文リスト
- Learning Low-Dimensional Strain Models of Soft Robots by Looking at the Evolution of Their Shape with Application to Model-Based Control [2.058941610795796]
本稿では,低次元物理モデル学習のための合理化手法を提案する。
各種平面ソフトマニピュレータを用いたシミュレーションにより,本手法の有効性を検証した。
物理的に互換性のあるモデルを生成する方法のおかげで、学習したモデルはモデルベースの制御ポリシーと簡単に組み合わせることができる。
論文 参考訳(メタデータ) (2024-10-31T18:37:22Z) - Real-to-Sim: Predicting Residual Errors of Robotic Systems with Sparse
Data using a Learning-based Unscented Kalman Filter [65.93205328894608]
我々は,動的・シミュレータモデルと実ロボット間の残差を学習する。
学習した残差誤差により、動的モデル、シミュレーション、および実際のハードウェア間の現実的ギャップをさらに埋めることができることを示す。
論文 参考訳(メタデータ) (2022-09-07T15:15:12Z) - Model-Based Reinforcement Learning with SINDy [0.0]
強化学習(RL)における物理系の非線形力学を規定する新しい手法を提案する。
本手法は,技術モデル学習アルゴリズムの状態よりもはるかに少ないトラジェクトリを用いて,基礎となるダイナミクスを発見することができることを確認した。
論文 参考訳(メタデータ) (2022-08-30T19:03:48Z) - Human Trajectory Prediction via Neural Social Physics [63.62824628085961]
軌道予測は多くの分野において広く研究され、多くのモデルベースおよびモデルフリーな手法が研究されている。
ニューラル微分方程式モデルに基づく新しい手法を提案する。
我々の新しいモデル(ニューラル社会物理学またはNSP)は、学習可能なパラメータを持つ明示的な物理モデルを使用するディープニューラルネットワークである。
論文 参考訳(メタデータ) (2022-07-21T12:11:18Z) - Physics-Inspired Temporal Learning of Quadrotor Dynamics for Accurate
Model Predictive Trajectory Tracking [76.27433308688592]
クオーロタのシステムダイナミクスを正確にモデル化することは、アジャイル、安全、安定したナビゲーションを保証する上で非常に重要です。
本稿では,ロボットの経験から,四重項系の力学を純粋に学習するための新しい物理インスパイアされた時間畳み込みネットワーク(PI-TCN)を提案する。
提案手法は,スパース時間的畳み込みと高密度フィードフォワード接続の表現力を組み合わせて,正確なシステム予測を行う。
論文 参考訳(メタデータ) (2022-06-07T13:51:35Z) - STEADY: Simultaneous State Estimation and Dynamics Learning from
Indirect Observations [17.86873192361793]
キノダイナミックモデル学習における最先端の多くのアプローチは、ラベル付き入力/出力の例としてロボットの状態の正確な測定を必要とする。
状態推定と動的学習を同時に行うことにより,ニューラルキノダイナミックモデルの学習手法を提案する。
提案手法は精度が大幅に向上するが, 観測音に対する堅牢性も向上し, 他の多くのロボティクスアプリケーションの性能向上が期待できる。
論文 参考訳(メタデータ) (2022-03-02T18:25:56Z) - Efficient Differentiable Simulation of Articulated Bodies [89.64118042429287]
本稿では, 音素の効率的な微分可能シミュレーション法を提案する。
これにより、ボディダイナミクスを深層学習フレームワークに統合することが可能になる。
提案手法を用いて, 調音システムによる強化学習を高速化できることを示す。
論文 参考訳(メタデータ) (2021-09-16T04:48:13Z) - Iterative Semi-parametric Dynamics Model Learning For Autonomous Racing [2.40966076588569]
本稿では,ニューラルネットワークを用いた反復学習セミパラメトリックモデルを自律レースの課題に適用する。
我々のモデルは純粋にパラメトリックモデルよりも正確に学習でき、純粋に非パラメトリックモデルよりもより一般化できることを示す。
論文 参考訳(メタデータ) (2020-11-17T16:24:10Z) - Trajectory-wise Multiple Choice Learning for Dynamics Generalization in
Reinforcement Learning [137.39196753245105]
本稿では,動的一般化のためのマルチヘッドダイナミックスモデルを学習するモデルベース強化学習アルゴリズムを提案する。
文脈学習は,過去の経験から得られる動的情報からコンテキスト潜在ベクトルにエンコードする。
提案手法は,最先端のRL法と比較して,様々な制御タスクにおいて優れたゼロショット一般化性能を示す。
論文 参考訳(メタデータ) (2020-10-26T03:20:42Z) - Automatic Differentiation and Continuous Sensitivity Analysis of Rigid
Body Dynamics [15.565726546970678]
剛体力学のための微分可能な物理シミュレータを提案する。
軌道最適化の文脈では、閉ループモデル予測制御アルゴリズムを導入する。
論文 参考訳(メタデータ) (2020-01-22T03:54:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。