論文の概要: Neural-iLQR: A Learning-Aided Shooting Method for Trajectory
Optimization
- arxiv url: http://arxiv.org/abs/2011.10737v3
- Date: Thu, 15 Sep 2022 14:10:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-22 22:56:20.822201
- Title: Neural-iLQR: A Learning-Aided Shooting Method for Trajectory
Optimization
- Title(参考訳): Neural-iLQR: 軌道最適化のための学習支援シューティング手法
- Authors: Zilong Cheng, Yulin Li, Kai Chen, Jun Ma, Tong Heng Lee
- Abstract要約: 制約のない制御空間上の学習支援シューティング手法であるNeural-iLQRを提案する。
システムモデルにおける不正確さの存在下で、従来のiLQRよりも著しく優れていることが示されている。
- 参考スコア(独自算出の注目度): 17.25824905485415
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Iterative linear quadratic regulator (iLQR) has gained wide popularity in
addressing trajectory optimization problems with nonlinear system models.
However, as a model-based shooting method, it relies heavily on an accurate
system model to update the optimal control actions and the trajectory
determined with forward integration, thus becoming vulnerable to inevitable
model inaccuracies. Recently, substantial research efforts in learning-based
methods for optimal control problems have been progressing significantly in
addressing unknown system models, particularly when the system has complex
interactions with the environment. Yet a deep neural network is normally
required to fit substantial scale of sampling data. In this work, we present
Neural-iLQR, a learning-aided shooting method over the unconstrained control
space, in which a neural network with a simple structure is used to represent
the local system model. In this framework, the trajectory optimization task is
achieved with simultaneous refinement of the optimal policy and the neural
network iteratively, without relying on the prior knowledge of the system
model. Through comprehensive evaluations on two illustrative control tasks, the
proposed method is shown to outperform the conventional iLQR significantly in
the presence of inaccuracies in system models.
- Abstract(参考訳): 反復線形二次レギュレータ (iLQR) は非線形システムモデルによる軌道最適化問題に対処するために広く普及している。
しかし、モデルベースの射撃法として、最適な制御アクションと前方統合によって決定される軌道を更新するための正確なシステムモデルに大きく依存し、避けられないモデルの不正確さに脆弱になる。
近年,未知のシステムモデル,特に環境との複雑な相互作用に対処する上で,学習に基づく最適制御問題の解法の研究が盛んに進められている。
しかし、ディープニューラルネットワークは通常、大量のサンプリングデータに適合するように要求される。
本研究では,非拘束的制御空間上の学習支援型シューティング手法であるNeural-iLQRを提案する。
この枠組みでは、システムモデルの事前知識に頼らずに、最適なポリシーとニューラルネットワークを反復的に洗練することで軌道最適化タスクを実現する。
2つの図形制御タスクの総合的な評価を通じて,システムモデルにおける不正確さの存在下で,従来のiLQRよりも優れた性能を示すことを示す。
関連論文リスト
- MPC of Uncertain Nonlinear Systems with Meta-Learning for Fast Adaptation of Neural Predictive Models [6.031205224945912]
ニューラル状態空間モデル(NSSM)は、ディープエンコーダネットワークがデータから非線形性を学ぶ非線形系を近似するために用いられる。
これにより非線形系を潜在空間の線形系に変換し、モデル予測制御(MPC)を用いて効果的な制御動作を決定する。
論文 参考訳(メタデータ) (2024-04-18T11:29:43Z) - Active Learning for Control-Oriented Identification of Nonlinear Systems [26.231260751633307]
本稿では,非線形力学の一般クラスに適した能動学習アルゴリズムの最初の有限サンプル解析について述べる。
ある設定では、アルゴリズムの過剰な制御コストは、対数係数まで、最適な速度を達成する。
我々は,非線形システムの制御におけるアクティブな制御指向探索の利点を示すとともに,シミュレーションにおける我々のアプローチを検証する。
論文 参考訳(メタデータ) (2024-04-13T15:40:39Z) - Deep autoregressive density nets vs neural ensembles for model-based
offline reinforcement learning [2.9158689853305693]
本稿では、利用可能なデータからシステムダイナミクスを推定し、仮想モデルロールアウトにおけるポリシー最適化を行うモデルベース強化学習アルゴリズムについて考察する。
このアプローチは、実際のシステムで破滅的な失敗を引き起こす可能性のあるモデルエラーを悪用することに対して脆弱である。
D4RLベンチマークの1つのよく校正された自己回帰モデルにより、より良い性能が得られることを示す。
論文 参考訳(メタデータ) (2024-02-05T10:18:15Z) - Model-Based Control with Sparse Neural Dynamics [23.961218902837807]
モデル学習と予測制御を統合した新しいフレームワークを提案する。
我々は,既存の最先端手法よりもクローズドループ性能を向上できることを示す。
論文 参考訳(メタデータ) (2023-12-20T06:25:02Z) - ConCerNet: A Contrastive Learning Based Framework for Automated
Conservation Law Discovery and Trustworthy Dynamical System Prediction [82.81767856234956]
本稿では,DNNに基づく動的モデリングの信頼性を向上させるために,ConCerNetという新しい学習フレームワークを提案する。
本手法は, 座標誤差と保存量の両方において, ベースラインニューラルネットワークよりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2023-02-11T21:07:30Z) - Supervised DKRC with Images for Offline System Identification [77.34726150561087]
現代の力学系はますます非線形で複雑なものになりつつある。
予測と制御のためのコンパクトで包括的な表現でこれらのシステムをモデル化するフレームワークが必要である。
本手法は,教師付き学習手法を用いてこれらの基礎関数を学習する。
論文 参考訳(メタデータ) (2021-09-06T04:39:06Z) - Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。
我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。
コア最適化問題の実用的なパラメトリゼーションを提供する。
論文 参考訳(メタデータ) (2021-07-08T18:01:02Z) - Gone Fishing: Neural Active Learning with Fisher Embeddings [55.08537975896764]
ディープニューラルネットワークと互換性のあるアクティブな学習アルゴリズムの必要性が高まっている。
本稿では,ニューラルネットワークのための抽出可能かつ高性能な能動学習アルゴリズムBAITを紹介する。
論文 参考訳(メタデータ) (2021-06-17T17:26:31Z) - DyNODE: Neural Ordinary Differential Equations for Dynamics Modeling in
Continuous Control [0.0]
本稿では,ニューラル常微分方程式の枠組みに制御を組み込むことにより,システムの基盤となる力学を捉える新しい手法を提案する。
以上の結果から,アクター批判強化学習アルゴリズムと組み合わせた単純なDyNODEアーキテクチャが,標準ニューラルネットワークより優れていることが示唆された。
論文 参考訳(メタデータ) (2020-09-09T12:56:58Z) - Logarithmic Regret Bound in Partially Observable Linear Dynamical
Systems [91.43582419264763]
部分的に観測可能な線形力学系におけるシステム同定と適応制御の問題について検討する。
開ループ系と閉ループ系の両方において有限時間保証付きの最初のモデル推定法を提案する。
AdaptOnは、未知の部分観測可能な線形力学系の適応制御において、$textpolylogleft(Tright)$ regretを達成する最初のアルゴリズムであることを示す。
論文 参考訳(メタデータ) (2020-03-25T06:00:33Z) - Information Theoretic Model Predictive Q-Learning [64.74041985237105]
本稿では,情報理論的MPCとエントロピー正規化RLとの新たな理論的関連性を示す。
バイアスモデルを利用したQ-ラーニングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2019-12-31T00:29:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。