論文の概要: Lyapunov Function-guided Reinforcement Learning for Flight Control
- arxiv url: http://arxiv.org/abs/2510.22840v1
- Date: Sun, 26 Oct 2025 21:18:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 15:28:15.390256
- Title: Lyapunov Function-guided Reinforcement Learning for Flight Control
- Title(参考訳): リアプノフ関数誘導型飛行制御強化学習
- Authors: Yifei Li, Erik-Jan van Kampen,
- Abstract要約: 動作のスムーズさに配慮して,ケースケードオンライン学習飛行制御システムを開発した。
Lyapunov関数候補の増大を特徴とする制御系の収束性能について検討する。
- 参考スコア(独自算出の注目度): 4.349671197115746
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A cascaded online learning flight control system has been developed and enhanced with respect to action smoothness. In this paper, we investigate the convergence performance of the control system, characterized by the increment of a Lyapunov function candidate. The derivation of this metric accounts for discretization errors and state prediction errors introduced by the incremental model. Comparative results are presented through flight control simulations.
- Abstract(参考訳): 動作のスムーズさに配慮して,ケースケードオンライン学習飛行制御システムを開発した。
本稿では,リアプノフ関数候補の増大を特徴とする制御系の収束性能について検討する。
この計量の導出は、漸進的モデルによって導入された離散化誤差と状態予測誤差を考慮に入れている。
比較実験は飛行制御シミュレーションを用いて行った。
関連論文リスト
- Model-Free versus Model-Based Reinforcement Learning for Fixed-Wing UAV
Attitude Control Under Varying Wind Conditions [1.474723404975345]
本稿では、PIDを基準点として、固定翼無人航空機の姿勢制御のためのモデルフリーおよびモデルベース強化学習の性能を評価し、比較する。
その結果, 時間差モデル予測制御は, PIDコントローラと他のモデルレス強化学習法の両方で, 精度と頑健さの点で優れていた。
論文 参考訳(メタデータ) (2024-09-26T14:47:14Z) - Cooperative Learning with Gaussian Processes for Euler-Lagrange Systems
Tracking Control under Switching Topologies [9.838373797093245]
本研究は,Euler-Lagrangeマルチエージェントシステムのトラッキング制御問題に取り組むための,革新的な学習ベースアプローチを提案する。
特筆すべき特徴は、達成した凝集重量を導出する際の例外的な効率である。
シミュレーション実験は、複雑なシナリオを効果的に管理するためのプロトコルの有効性を検証する。
論文 参考訳(メタデータ) (2024-02-05T14:33:52Z) - Improving the Performance of Robust Control through Event-Triggered
Learning [74.57758188038375]
LQR問題における不確実性に直面していつ学習するかを決定するイベントトリガー学習アルゴリズムを提案する。
本研究では,ロバストな制御器ベースライン上での性能向上を数値例で示す。
論文 参考訳(メタデータ) (2022-07-28T17:36:37Z) - Lyapunov Density Models: Constraining Distribution Shift in
Learning-Based Control [64.61499213110334]
我々はエージェントを訓練された状態や行動に制約するメカニズムを模索する。
制御理論において、リャプノフ安定性と制御不変集合は、コントローラについて保証することを可能にする。
密度モデルによって トレーニングデータの分布を推定できます
論文 参考訳(メタデータ) (2022-06-21T16:49:09Z) - Interpretable Stochastic Model Predictive Control using Distributional
Reinforced Estimation for Quadrotor Tracking Systems [0.8411385346896411]
本研究では,動的・複雑環境下での自律的四角形ナビゲーションのためのトラジェクトリトラッカーを提案する。
提案フレームワークは,未知の空力効果に対する分散強化学習推定器をモデル予測制御器に統合する。
我々は,未知かつ多様な空気力を用いて,累積追従誤差を少なくとも66%改善するシステムを実証した。
論文 参考訳(メタデータ) (2022-05-14T23:27:38Z) - Robustness of Control Design via Bayesian Learning [0.0]
これらの知見に触発されて,制御探索課題におけるベイズ学習の頑健性を示す。
一次元開放ループ不安定系を安定化する線形制御器を求める。
論文 参考訳(メタデータ) (2022-05-13T21:10:19Z) - The Impact of Data on the Stability of Learning-Based Control- Extended
Version [63.97366815968177]
本稿では,Lyapunovをベースとした,認証制御性能に対するデータの影響の定量化手法を提案する。
ガウス過程を通じて未知系の力学をモデル化することにより、モデルの不確実性と安定性条件の満足度の間の相互関係を決定できる。
論文 参考訳(メタデータ) (2020-11-20T19:10:01Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Certainty Equivalent Perception-Based Control [29.216967322052785]
動的に達成可能な高密度サンプリングスキームの下で,非カーネル回帰に拘束される一様誤差を示す。
これにより、経路追跡のためにクローズドループの回帰器を使用する場合の準最適性に対する有限時間収束率が得られる。
論文 参考訳(メタデータ) (2020-08-27T18:45:40Z) - Anticipating the Long-Term Effect of Online Learning in Control [75.6527644813815]
AntLerは、学習を予想する学習ベースの制御法則の設計アルゴリズムである。
AntLer は確率 1 と任意に最適な解を近似することを示す。
論文 参考訳(メタデータ) (2020-07-24T07:00:14Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。