論文の概要: Interpretable Stochastic Model Predictive Control using Distributional
Reinforced Estimation for Quadrotor Tracking Systems
- arxiv url: http://arxiv.org/abs/2205.07150v1
- Date: Sat, 14 May 2022 23:27:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-17 15:16:21.227386
- Title: Interpretable Stochastic Model Predictive Control using Distributional
Reinforced Estimation for Quadrotor Tracking Systems
- Title(参考訳): 四角形追従系の分布強化推定を用いた解釈確率モデル予測制御
- Authors: Yanran Wang, James O'Keeffe, Qiuchen Qian, David Boyle
- Abstract要約: 本研究では,動的・複雑環境下での自律的四角形ナビゲーションのためのトラジェクトリトラッカーを提案する。
提案フレームワークは,未知の空力効果に対する分散強化学習推定器をモデル予測制御器に統合する。
我々は,未知かつ多様な空気力を用いて,累積追従誤差を少なくとも66%改善するシステムを実証した。
- 参考スコア(独自算出の注目度): 0.8411385346896411
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a novel trajectory tracker for autonomous quadrotor
navigation in dynamic and complex environments. The proposed framework
integrates a distributional Reinforcement Learning (RL) estimator for unknown
aerodynamic effects into a Stochastic Model Predictive Controller (SMPC) for
trajectory tracking. Aerodynamic effects derived from drag forces and moment
variations are difficult to model directly and accurately. Most current
quadrotor tracking systems therefore treat them as simple `disturbances' in
conventional control approaches. We propose Quantile-approximation-based
Distributional Reinforced-disturbance-estimator, an aerodynamic disturbance
estimator, to accurately identify disturbances, i.e., uncertainties between the
true and estimated values of aerodynamic effects. Simplified Affine Disturbance
Feedback is employed for control parameterization to guarantee convexity, which
we then integrate with a SMPC to achieve sufficient and non-conservative
control signals. We demonstrate our system to improve the cumulative tracking
errors by at least 66% with unknown and diverse aerodynamic forces compared
with recent state-of-the-art. Concerning traditional Reinforcement Learning's
non-interpretability, we provide convergence and stability guarantees of
Distributional RL and SMPC, respectively, with non-zero mean disturbances.
- Abstract(参考訳): 本稿では,動的および複雑な環境における自律四重子ナビゲーションのための新しい軌跡追跡器を提案する。
提案フレームワークは,未知の空力効果に対する分布強化学習(RL)推定器を軌道追跡のための確率モデル予測制御器(SMPC)に統合する。
ドラッグ力とモーメント変動から導かれる空力効果を直接的かつ正確にモデル化することは困難である。
したがって、現在のほとんどの四角形追跡システムは、従来の制御アプローチでは単純な 'disturbances' として扱う。
本研究では,空力効果の真の値と推定値の不確かさを正確に識別するために,気力外乱推定器である分位近似分布型風力外乱推定器を提案する。
簡易なアフィン外乱フィードバックは、凸性を保証するために制御パラメータ化に使われ、SMPCと統合して十分かつ保守的でない制御信号を得る。
本研究では, 空力力の未知と多様さにより, 累積追尾誤差を少なくとも66%改善できることを示す。
従来の強化学習の非解釈性については, 分散RLとSMPCの収束性, 安定性保証, 非ゼロ平均乱れをそれぞれ提供する。
関連論文リスト
- Integrating DeepRL with Robust Low-Level Control in Robotic Manipulators for Non-Repetitive Reaching Tasks [0.24578723416255746]
ロボット工学では、現代の戦略は学習に基づくもので、複雑なブラックボックスの性質と解釈可能性の欠如が特徴である。
本稿では, 深部強化学習(DRL)に基づく衝突のない軌道プランナと, 自動調整型低レベル制御戦略を統合することを提案する。
論文 参考訳(メタデータ) (2024-02-04T15:54:03Z) - Provable Guarantees for Generative Behavior Cloning: Bridging Low-Level
Stability and High-Level Behavior [51.60683890503293]
生成モデルを用いた複雑な専門家による実演の行動クローニングに関する理論的枠組みを提案する。
任意の専門的軌跡の時間ごとのステップ分布に一致するトラジェクトリを生成することができることを示す。
論文 参考訳(メタデータ) (2023-07-27T04:27:26Z) - Constrained Reinforcement Learning using Distributional Representation for Trustworthy Quadrotor UAV Tracking Control [2.325021848829375]
本研究では, 未知の空力効果に対する分散強化学習障害推定器を統合した新しいトラジェクトリトラッカーを提案する。
提案手法は, 空気力学効果の真値と推定値の不確かさを正確に同定する。
本システムは,最近の技術と比較して,累積追尾誤差を少なくとも70%改善することを示した。
論文 参考訳(メタデータ) (2023-02-22T23:15:56Z) - A GOA-Based Fault-Tolerant Trajectory Tracking Control for an Underwater
Vehicle of Multi-Thruster System without Actuator Saturation [9.371458775465825]
本稿では,スラスタ損傷(パワーロス)を受けた水中車両(UV)の軌道追尾問題に対処するために,インテリジェントな耐故障制御(FTC)戦略を提案する。
提案した制御戦略では、速度変化を制御する改良されたバックステッピングアルゴリズムにより軌道追跡成分を形成し、スライディングモード制御によりトルク/フォース出力を減算する。
論文 参考訳(メタデータ) (2023-01-04T21:30:16Z) - Physics-Inspired Temporal Learning of Quadrotor Dynamics for Accurate
Model Predictive Trajectory Tracking [76.27433308688592]
クオーロタのシステムダイナミクスを正確にモデル化することは、アジャイル、安全、安定したナビゲーションを保証する上で非常に重要です。
本稿では,ロボットの経験から,四重項系の力学を純粋に学習するための新しい物理インスパイアされた時間畳み込みネットワーク(PI-TCN)を提案する。
提案手法は,スパース時間的畳み込みと高密度フィードフォワード接続の表現力を組み合わせて,正確なシステム予測を行う。
論文 参考訳(メタデータ) (2022-06-07T13:51:35Z) - Robustness and Accuracy Could Be Reconcilable by (Proper) Definition [109.62614226793833]
強靭性と精度のトレードオフは、敵文学において広く研究されている。
局所的不変性の帰納的バイアスを課す不適切に定義された頑健な誤差に由来する可能性がある。
定義上、SCOREは、最悪のケースの不確実性に対処しながら、堅牢性と正確性の間の和解を促進する。
論文 参考訳(メタデータ) (2022-02-21T10:36:09Z) - Guaranteed Trajectory Tracking under Learned Dynamics with Contraction Metrics and Disturbance Estimation [5.147919654191323]
本稿では,制約指標と外乱推定に基づく軌道中心学習制御へのアプローチを提案する。
提案するフレームワークは、平面四重項の例で検証される。
論文 参考訳(メタデータ) (2021-12-15T15:57:33Z) - Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。
本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文 参考訳(メタデータ) (2021-05-17T08:36:18Z) - Approximate Robust NMPC using Reinforcement Learning [0.0]
障害や不確実性の存在下で非線形システムを制御するための強化学習に基づくロバストモデル予測制御(RL-RNMPC)を提案する。
論文 参考訳(メタデータ) (2021-04-06T18:34:58Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。