論文の概要: Policy Search for Model Predictive Control with Application to Agile
Drone Flight
- arxiv url: http://arxiv.org/abs/2112.03850v1
- Date: Tue, 7 Dec 2021 17:39:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-08 15:24:21.916063
- Title: Policy Search for Model Predictive Control with Application to Agile
Drone Flight
- Title(参考訳): アジャイルドローン飛行への適用によるモデル予測制御のポリシー探索
- Authors: Yunlong Song, Davide Scaramuzza
- Abstract要約: MPCのためのポリシ・フォー・モデル・予測制御フレームワークを提案する。
具体的には、パラメータ化コントローラとしてMPCを定式化し、パラメータ化の難しい決定変数を高レベルポリシーとして表現する。
シミュレーションと実環境の両方において,我々の制御器が堅牢かつリアルタイムに制御性能を発揮することを示す実験を行った。
- 参考スコア(独自算出の注目度): 56.24908013905407
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Policy Search and Model Predictive Control~(MPC) are two different paradigms
for robot control: policy search has the strength of automatically learning
complex policies using experienced data, while MPC can offer optimal control
performance using models and trajectory optimization. An open research question
is how to leverage and combine the advantages of both approaches. In this work,
we provide an answer by using policy search for automatically choosing
high-level decision variables for MPC, which leads to a novel
policy-search-for-model-predictive-control framework. Specifically, we
formulate the MPC as a parameterized controller, where the hard-to-optimize
decision variables are represented as high-level policies. Such a formulation
allows optimizing policies in a self-supervised fashion. We validate this
framework by focusing on a challenging problem in agile drone flight: flying a
quadrotor through fast-moving gates. Experiments show that our controller
achieves robust and real-time control performance in both simulation and the
real world. The proposed framework offers a new perspective for merging
learning and control.
- Abstract(参考訳): ポリシーサーチとモデル予測制御(mpc)はロボット制御の2つの異なるパラダイムである: ポリシーサーチは経験豊富なデータを使って複雑なポリシーを自動的に学習する強みを持ち、mpcはモデルと軌道最適化を使って最適な制御性能を提供する。
オープンな研究課題は、両方のアプローチの利点をどのように活用し、組み合わせるかである。
本研究では,MPC の高次決定変数を自動的に選択するポリシー探索を用いて,新しいポリシー探索・モデル予測制御フレームワークを提案する。
具体的には、パラメータ化コントローラとしてMPCを定式化し、パラメータ化の難しい決定変数を高レベルポリシーとして表現する。
このような定式化は、自己監督的な方法でポリシーを最適化することを可能にする。
このフレームワークを検証するために,アジャイルなドローン飛行における課題である,速動ゲートを通過するクワッドローターの飛行に注目する。
実験の結果,シミュレーションと実世界の両方において,ロバストかつリアルタイムな制御性能が得られた。
提案するフレームワークは、学習と制御を統合するための新しい視点を提供する。
関連論文リスト
- Comparison of Model Predictive Control and Proximal Policy Optimization for a 1-DOF Helicopter System [0.7499722271664147]
本研究は,Quanser Aero 2システムに適用された深層強化学習(DRL)アルゴリズムであるモデル予測制御(MPC)とPPOの比較分析を行う。
PPOは上昇時間と適応性に優れており、迅速な応答と適応性を必要とするアプリケーションには有望なアプローチである。
論文 参考訳(メタデータ) (2024-08-28T08:35:34Z) - Tuning Legged Locomotion Controllers via Safe Bayesian Optimization [47.87675010450171]
本稿では,ロボットハードウェアプラットフォームにおけるモデルベースコントローラの展開を効率化するための,データ駆動型戦略を提案する。
モデルフリーな安全な学習アルゴリズムを用いて制御ゲインのチューニングを自動化し、制御定式化で使用される単純化されたモデルと実システムとのミスマッチに対処する。
論文 参考訳(メタデータ) (2023-06-12T13:10:14Z) - Efficient Domain Coverage for Vehicles with Second-Order Dynamics via
Multi-Agent Reinforcement Learning [9.939081691797858]
本稿では,2次動的エージェントを含む多エージェント効率ドメインカバレッジ問題に対する強化学習(RL)手法を提案する。
提案するネットワークアーキテクチャには,LSTMと自己注意が組み込まれている。
論文 参考訳(メタデータ) (2022-11-11T01:59:12Z) - Learning Model Predictive Controllers with Real-Time Attention for
Real-World Navigation [34.86856430694435]
本稿では,模擬学習の利点とシステム制約の頑健な処理を併用した,暗黙的な制御ポリシーの新たなクラスを提案する。
Performer-MPCと呼ばれる我々の手法は、Performerが提供する視覚コンテキストの埋め込みによってパラメータ化された学習コスト関数を使用する。
標準的なMPCポリシーと比較して、Performer-MPCは、乱雑な環境で到達した目標を40%以上達成し、人間の周りを移動する際の社会的指標を65%以上向上させる。
論文 参考訳(メタデータ) (2022-09-22T04:57:58Z) - Evaluating model-based planning and planner amortization for continuous
control [79.49319308600228]
我々は、モデル予測制御(MPC)と学習モデルとモデルフリーポリシー学習を組み合わせたハイブリッドアプローチを採っている。
モデルフリーエージェントは高いDoF制御問題においても強いベースラインであることがわかった。
モデルに基づくプランナを,パフォーマンスを損なうことなく,計画が損なわれるようなポリシーに置き換えることが可能であることを示す。
論文 参考訳(メタデータ) (2021-10-07T12:00:40Z) - Imitation Learning from MPC for Quadrupedal Multi-Gait Control [63.617157490920505]
本稿では,歩行ロボットの複数の歩行を模倣する単一ポリシーを学習する学習アルゴリズムを提案する。
モデル予測制御によって導かれる模擬学習のアプローチであるMPC-Netを使用し、拡張します。
ハードウェアに対する我々のアプローチを検証し、学習したポリシーが教師に取って代わって複数の歩留まりを制御できることを示します。
論文 参考訳(メタデータ) (2021-03-26T08:48:53Z) - Learning High-Level Policies for Model Predictive Control [54.00297896763184]
Model Predictive Control (MPC)は、ロボット制御タスクに対する堅牢なソリューションを提供する。
ニューラルネットワークの高レベルポリシーを学習するための自己教師付き学習アルゴリズムを提案する。
提案手法は, 標準的なMPCでは困難な状況に対処できることを示す。
論文 参考訳(メタデータ) (2020-07-20T17:12:34Z) - Guided Constrained Policy Optimization for Dynamic Quadrupedal Robot
Locomotion [78.46388769788405]
我々は,制約付きポリシー最適化(CPPO)の実装に基づくRLフレームワークであるGCPOを紹介する。
誘導制約付きRLは所望の最適値に近い高速収束を実現し,正確な報酬関数チューニングを必要とせず,最適かつ物理的に実現可能なロボット制御動作を実現することを示す。
論文 参考訳(メタデータ) (2020-02-22T10:15:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。