論文の概要: MPC for underactuated spacecraft control with a Lyapunov supervised physics-informed neural network correction layer
- arxiv url: http://arxiv.org/abs/2606.13113v1
- Date: Thu, 11 Jun 2026 09:39:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.704431
- Title: MPC for underactuated spacecraft control with a Lyapunov supervised physics-informed neural network correction layer
- Title(参考訳): Lyapunov制御型ニューラルネットワーク補正層を用いた不活性化宇宙船制御のためのMPC
- Authors: Amirhossein Ayanmanesh Motlaghmofrad, Carlo Cena, Mauro Martini, Marcello Chiaberge,
- Abstract要約: 未作動の宇宙船は、制御可能性の限界に直面し、環境障害に対する感度を高める。
i) 非線形モデル予測制御器(NMPC) の制約と非作動性を考慮した操作計画と, アクチュエータリミット下での名目上の閉ループ安定性, (ii) 物理インフォームドニューラルネットワーク(PINN) シミュレーションデータをオフラインでトレーニングし, 残差トルクを推定すること, (iii) 学習した補正をオンラインで評価し, ベースラインコントローラの安定性を維持または抑制するリアプノフベースの監視安全機構。
- 参考スコア(独自算出の注目度): 2.4919077201316067
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Underactuated spacecraft faces controllability limitations and heightened sensitivity to environmental disturbances, complicating attitude maneuvering and stabilization. Due to the lack of control authority along the underactuated axis, conventional controllers cannot directly stabilize all attitude components and therefore require reference planning strategies. Furthermore, MPC approaches remain sensitive to inertia uncertainty and unmodeled dynamic couplings, resulting in degraded tracking performance under mismatch. To address these issues, we consider a hierarchical architecture integrating three layers: (i) a nonlinear model predictive controller (NMPC) for constraint and underactuation-aware maneuver planning and nominal closed-loop stability under actuator limits; (ii) a physics-informed neural network (PINN) trained offline on simulation data to estimate residual disturbance torques, with loss terms that enforce consistency with rigid-body rotational dynamics; (iii) a Lyapunov-based supervisory safety mechanism that evaluates the learned correction online and bounds or suppresses its influence to preserve the stability properties of the baseline controller. The architecture is evaluated in a high-fidelity simulation environment modelling reaction wheel dynamics, actuator saturation, and environmental disturbances. Monte Carlo studies show statistically significant reductions in steady-state attitude error relative to standalone NMPC while maintaining robust behavior under uncertainty. The supervisory layer ensures graceful degradation to purely model-based control when the learning-based augmentation is unreliable.
- Abstract(参考訳): 不安定な宇宙船は、制御可能性の限界に直面し、環境障害に対する感受性を高め、姿勢の操作と安定化を複雑にする。
不活性化軸に沿った制御権限の欠如により、従来の制御装置はすべての姿勢成分を直接安定させることができないため、参照計画戦略を必要とする。
さらに、MPC手法は慣性不確かさや非モデル化された動的結合に敏感であり、ミスマッチ時の追従性能が低下する。
これらの問題に対処するために、我々は3つのレイヤを統合する階層アーキテクチャを検討します。
(i)非線型モデル予測制御器(NMPC)
(II) 物理インフォームドニューラルネットワーク(PINN)は、剛体回転力学との整合性を強制する損失項を有する残留乱れトルクを推定するために、シミュレーションデータ上でオフラインで訓練した。
三 学習した補正をオンラインで評価し、その影響を抑え、ベースラインコントローラの安定性の維持を図る、リャプノフに基づく監督安全機構。
この構造は, 反応輪の力学, アクチュエータ飽和, 環境障害をモデル化した高忠実度シミュレーション環境において評価される。
モンテカルロの研究では、不確実性の下で頑健な振舞いを維持しながら、スタンドアローンNMPCに対する定常姿勢誤差の統計的に有意な減少を示す。
教師層は、学習ベースの強化が信頼できない場合に、純粋にモデルベース制御に対する優雅な劣化を保証する。
関連論文リスト
- Safety-Guaranteed Imitation Learning from Nonlinear Model Predictive Control for Spacecraft Close Proximity Operations [39.146761527401424]
本稿では,宇宙船近接制御のための安全保証型,実行時効率の模倣学習フレームワークを提案する。
安全証明書にはCBF(Control Barrier Functions)、安定性にはCLF(Control Lyapunov Functions)を活用しています。
実行時分析では、市販のオフザシェルフプロセッサでリアルタイムに実現可能であることを示し、安全クリティカルな軌道上サービスのためのオンボードデプロイメントをサポートする。
論文 参考訳(メタデータ) (2026-03-19T13:47:18Z) - Intelligent Control of Differential Drive Robots Subject to Unmodeled Dynamics with EKF-based State Estimation [28.37226750522601]
この研究は、リアプノフに基づく非線形コントローラと適応ネットワーク(ANN)を組み合わせた統一制御と状態推定フレームワークを導入する。
提案した制御器はニューラルネットワークの普遍近似特性を利用して未知の非線形性をリアルタイムでモデル化する。
堅牢な状態推定を保証するため、EKFは単分子、2D-LiDARおよびホイールエンコーダから慣性測定ユニット(IMU)とオドメトリーを融合させる。
論文 参考訳(メタデータ) (2026-03-16T07:44:28Z) - Sim2Act: Robust Simulation-to-Decision Learning via Adversarial Calibration and Group-Relative Perturbation [54.29523408543184]
シミュレーションと意思決定の学習は、現実世界の展開を危険にさらすことなく、デジタル環境で安全なポリシートレーニングを可能にする。
既存のアプローチでは、平均的なシミュレーションの忠実さを改善するか、保守的な正規化を採用するかに重点を置いている。
提案するSim2Actは,シミュレータとポリシーのロバスト性の両方に対処するロバストなシミュレーション・トゥ・意思決定フレームワークである。
論文 参考訳(メタデータ) (2026-03-10T00:51:47Z) - When Sensors Fail: Temporal Sequence Models for Robust PPO under Sensor Drift [64.37959940809633]
時間的持続的なセンサ故障下でのPPOのロバスト性について検討する。
トランスフォーマーを用いたシーケンスポリシーは, センサ数が少ない場合でも高いリターンを保ちながら, 堅牢性, RNN, SSMよりも大幅に優れていた。
論文 参考訳(メタデータ) (2026-03-04T22:21:54Z) - Dual-quaternion learning control for autonomous vehicle trajectory tracking with safety guarantees [39.146761527401424]
運動を運動論的に記述できる自律型ロボットプラットフォームのための学習型軌道追跡制御器を提案する。
コントローラは二重四元数フレームワークで定式化され、角速度と直線速度の直接の指令を仮定して速度レベルで動作する。
論文 参考訳(メタデータ) (2026-01-06T15:30:02Z) - Integrating DeepRL with Robust Low-Level Control in Robotic Manipulators for Non-Repetitive Reaching Tasks [0.24578723416255746]
ロボット工学では、現代の戦略は学習に基づくもので、複雑なブラックボックスの性質と解釈可能性の欠如が特徴である。
本稿では, 深部強化学習(DRL)に基づく衝突のない軌道プランナと, 自動調整型低レベル制御戦略を統合することを提案する。
論文 参考訳(メタデータ) (2024-02-04T15:54:03Z) - Constrained Reinforcement Learning using Distributional Representation for Trustworthy Quadrotor UAV Tracking Control [2.325021848829375]
本研究では, 未知の空力効果に対する分散強化学習障害推定器を統合した新しいトラジェクトリトラッカーを提案する。
提案手法は, 空気力学効果の真値と推定値の不確かさを正確に同定する。
本システムは,最近の技術と比較して,累積追尾誤差を少なくとも70%改善することを示した。
論文 参考訳(メタデータ) (2023-02-22T23:15:56Z) - Learning Variable Impedance Control for Aerial Sliding on Uneven
Heterogeneous Surfaces by Proprioceptive and Tactile Sensing [42.27572349747162]
本研究では,空中すべり作業に対する学習に基づく適応制御手法を提案する。
提案するコントローラ構造は,データ駆動制御とモデルベース制御を組み合わせたものである。
美術品間相互作用制御手法の微調整状態と比較して,追従誤差の低減と外乱拒否の改善を実現した。
論文 参考訳(メタデータ) (2022-06-28T16:28:59Z) - Interpretable Stochastic Model Predictive Control using Distributional
Reinforced Estimation for Quadrotor Tracking Systems [0.8411385346896411]
本研究では,動的・複雑環境下での自律的四角形ナビゲーションのためのトラジェクトリトラッカーを提案する。
提案フレームワークは,未知の空力効果に対する分散強化学習推定器をモデル予測制御器に統合する。
我々は,未知かつ多様な空気力を用いて,累積追従誤差を少なくとも66%改善するシステムを実証した。
論文 参考訳(メタデータ) (2022-05-14T23:27:38Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。