論文の概要: A Fast Initialization Method for Neural Network Controllers: A Case Study of Image-based Visual Servoing Control for the multicopter Interception
- arxiv url: http://arxiv.org/abs/2509.19110v1
- Date: Tue, 23 Sep 2025 14:56:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-24 20:41:27.913454
- Title: A Fast Initialization Method for Neural Network Controllers: A Case Study of Image-based Visual Servoing Control for the multicopter Interception
- Title(参考訳): ニューラルネットワーク制御器の高速初期化法:マルチコプター・インターセプションのための画像ベースビジュアルサーボ制御の一事例
- Authors: Chenxu Ke, Congling Tian, Kaichen Xu, Ye Li, Lingcong Bao,
- Abstract要約: 強化学習に基づくコントローラ設計法は、初期訓練段階でかなりのデータを必要とすることが多い。
安定なニューラルネットワークコントローラは、強化学習の初期ポリシーとして機能するだけでなく、学習ベースのリアプノフ制御方法の初期状態としても機能する。
- 参考スコア(独自算出の注目度): 5.006133776992552
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reinforcement learning-based controller design methods often require substantial data in the initial training phase. Moreover, the training process tends to exhibit strong randomness and slow convergence. It often requires considerable time or high computational resources. Another class of learning-based method incorporates Lyapunov stability theory to obtain a control policy with stability guarantees. However, these methods generally require an initially stable neural network control policy at the beginning of training. Evidently, a stable neural network controller can not only serve as an initial policy for reinforcement learning, allowing the training to focus on improving controller performance, but also act as an initial state for learning-based Lyapunov control methods. Although stable controllers can be designed using traditional control theory, designers still need to have a great deal of control design knowledge to address increasingly complicated control problems. The proposed neural network rapid initialization method in this paper achieves the initial training of the neural network control policy by constructing datasets that conform to the stability conditions based on the system model. Furthermore, using the image-based visual servoing control for multicopter interception as a case study, simulations and experiments were conducted to validate the effectiveness and practical performance of the proposed method. In the experiment, the trained control policy attains a final interception velocity of 15 m/s.
- Abstract(参考訳): 強化学習に基づくコントローラ設計法は、初期訓練段階でかなりのデータを必要とすることが多い。
さらに、トレーニングプロセスは強いランダム性と緩やかな収束を示す傾向にある。
時間や高い計算資源を必要とすることが多い。
学習に基づく別の方法のクラスは、安定性を保証する制御ポリシーを得るためにリャプノフ安定性理論を取り入れている。
しかしながら、これらの手法はトレーニング開始時に初期安定なニューラルネットワーク制御ポリシーを必要とするのが一般的である。
明らかに、安定したニューラルネットワークコントローラは強化学習の初期ポリシーとして機能するだけでなく、学習ベースのリアプノフ制御方法の初期状態としても機能する。
安定したコントローラは従来の制御理論を使って設計できるが、設計者はますます複雑な制御問題に対処するために、多くの制御設計知識を持つ必要がある。
本稿では,システムモデルに基づく安定性条件に適合したデータセットを構築することにより,ニューラルネットワーク制御ポリシの初期訓練を実現する。
さらに,マルチコプター・インターセプションのための画像ベースビジュアルサーボ制御を事例として,シミュレーションと実験を行い,提案手法の有効性と実用性について検証した。
実験では、訓練された制御ポリシーが15m/sの最終インターセプション速度を達成する。
関連論文リスト
- A minimax optimal control approach for robust neural ODEs [44.99833362998488]
我々は、頑健な制御の観点から、ニューラルなODEの敵対的訓練に対処する。
我々はポントリャーギンの最大原理の形で一階最適条件を導出する。
論文 参考訳(メタデータ) (2023-10-26T17:07:43Z) - Deep Learning for Wireless Networked Systems: a joint
Estimation-Control-Scheduling Approach [47.29474858956844]
ワイヤレスネットワーク制御システム(Wireless Networked Control System, WNCS)は、無線通信を介してセンサ、コントローラ、アクチュエータを接続する技術であり、産業用 4.0 時代において、高度にスケーラブルで低コストな制御システムの展開を可能にする技術である。
WNCSにおける制御と通信の密接な相互作用にもかかわらず、既存のほとんどの研究は分離設計アプローチを採用している。
モデルフリーデータとモデルベースデータの両方を利用する制御と最適化のための,DRLに基づく新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-10-03T01:29:40Z) - A stabilizing reinforcement learning approach for sampled systems with
partially unknown models [0.0]
純粋オンライン学習環境におけるシステム制御器閉ループの実用的安定性を保証する手法を提案する。
要求された結果を達成するため、我々は古典的な適応制御技術を採用する。
この方法は適応的なトラクション制御とクルーズ制御でテストされ、コストを大幅に削減することが判明した。
論文 参考訳(メタデータ) (2022-08-31T09:20:14Z) - Improving the Performance of Robust Control through Event-Triggered
Learning [74.57758188038375]
LQR問題における不確実性に直面していつ学習するかを決定するイベントトリガー学習アルゴリズムを提案する。
本研究では,ロバストな制御器ベースライン上での性能向上を数値例で示す。
論文 参考訳(メタデータ) (2022-07-28T17:36:37Z) - Neural Network Based Model Predictive Control for an Autonomous Vehicle [3.222802562733787]
本研究では,自律走行車制御のためのモデル予測コントローラ(MPC)の代替として,学習ベースコントローラについて検討する。
教師あり学習と強化学習による学習を比較した。
本研究の目的は,リアルタイムプラットフォームに組み込み,形式的手法による検証が可能なコントローラの開発である。
論文 参考訳(メタデータ) (2021-07-30T12:11:31Z) - Learning-based vs Model-free Adaptive Control of a MAV under Wind Gust [0.2770822269241973]
未知の条件下でのナビゲーション問題は、制御分野において最も重要でよく研究されている問題の一つである。
近年のモデルフリー適応制御法は, センサフィードバックから直接植物の物理的特性を学習することにより, この依存を除去することを目的としている。
提案手法は,深い強化学習フレームワークによって頑健に調整された完全状態フィードバックコントローラからなる,概念的にシンプルな学習ベースアプローチを提案する。
論文 参考訳(メタデータ) (2021-01-29T10:13:56Z) - Enforcing robust control guarantees within neural network policies [76.00287474159973]
本稿では、ニューラルネットワークによってパラメータ化され、ロバスト制御と同じ証明可能なロバスト性基準を適用した、一般的な非線形制御ポリシークラスを提案する。
提案手法は,複数の領域において有効であり,既存のロバスト制御法よりも平均ケース性能が向上し,(非ロバスト)深部RL法よりも最悪のケース安定性が向上した。
論文 参考訳(メタデータ) (2020-11-16T17:14:59Z) - Model-Free Control of Dynamical Systems with Deep Reservoir Computing [0.0]
本稿では,未知の複雑なシステムに適用可能な非線形制御法を提案する。
我々の手法はシステムに関する事前の知識を必要としないため、モデルフリーである。
貯留層コンピュータは、小さなトレーニングデータセットと驚くほど低いトレーニング時間を必要とするため、制御問題に適している。
論文 参考訳(メタデータ) (2020-10-05T18:59:51Z) - Learning a Contact-Adaptive Controller for Robust, Efficient Legged
Locomotion [95.1825179206694]
四足歩行ロボットのためのロバストコントローラを合成するフレームワークを提案する。
高レベルコントローラは、環境の変化に応じてプリミティブのセットを選択することを学習する。
確立された制御方法を使用してプリミティブを堅牢に実行する低レベルコントローラ。
論文 参考訳(メタデータ) (2020-09-21T16:49:26Z) - Optimal PID and Antiwindup Control Design as a Reinforcement Learning
Problem [3.131740922192114]
DRL制御法の解釈可能性に着目した。
特に、線形固定構造コントローラをアクター・クリティカル・フレームワークに埋め込まれた浅層ニューラルネットワークとみなす。
論文 参考訳(メタデータ) (2020-05-10T01:05:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。