論文の概要: Imitation learning-based spacecraft rendezvous and docking method with Expert Demonstration
- arxiv url: http://arxiv.org/abs/2601.12952v1
- Date: Mon, 19 Jan 2026 10:58:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:40.840828
- Title: Imitation learning-based spacecraft rendezvous and docking method with Expert Demonstration
- Title(参考訳): シミュレーション学習による宇宙船のランデブーとドッキング法
- Authors: Shibo Shao, Dong Zhou, Guanghui Sun, Liwen Zhang, Mingxuan Jiang,
- Abstract要約: 既存の宇宙船のランデブーとドッキング制御方法は、事前に定義された動的モデルに依存している。
本稿では,専門家による実証から制御ポリシーを学習するImitation Learningベースのフレームワークを提案する。
提案手法は高精度でエネルギー効率の良いモデルレスランデブーとドッキング制御を実現する。
- 参考スコア(独自算出の注目度): 8.727025636218528
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing spacecraft rendezvous and docking control methods largely rely on predefined dynamic models and often exhibit limited robustness in realistic on-orbit environments. To address this issue, this paper proposes an Imitation Learning-based spacecraft rendezvous and docking control framework (IL-SRD) that directly learns control policies from expert demonstrations, thereby reducing dependence on accurate modeling. We propose an anchored decoder target mechanism, which conditions the decoder queries on state-related anchors to explicitly constrain the control generation process. This mechanism enforces physically consistent control evolution and effectively suppresses implausible action deviations in sequential prediction, enabling reliable six-degree-of-freedom (6-DOF) rendezvous and docking control. To further enhance stability, a temporal aggregation mechanism is incorporated to mitigate error accumulation caused by the sequential prediction nature of Transformer-based models, where small inaccuracies at each time step can propagate and amplify over long horizons. Extensive simulation results demonstrate that the proposed IL-SRD framework achieves accurate and energy-efficient model-free rendezvous and docking control. Robustness evaluations further confirm its capability to maintain competitive performance under significant unknown disturbances. The source code is available at https://github.com/Dongzhou-1996/IL-SRD.
- Abstract(参考訳): 既存の宇宙船のランデブーとドッキング制御法は、主に既定のダイナミックモデルに依存しており、現実的な軌道上の環境では限られたロバスト性を示すことが多い。
そこで本研究では,Imitation Learningベースの宇宙船ランデブーとドッキング制御フレームワーク(IL-SRD)を提案する。
本稿では,制御生成過程を明示的に制約するために,状態関連アンカー上でのデコーダクエリを条件としたアンカーデコーダターゲット機構を提案する。
このメカニズムは、物理的に一貫した制御の進化を強制し、シーケンシャルな予測において予測できない行動偏差を効果的に抑制し、信頼できる6自由度(6-DOF)のランデブーとドッキング制御を可能にする。
安定性をさらに向上するため,Transformer ベースモデルの逐次予測特性による誤差蓄積を緩和するために,時間的集約機構を組み込んだ。
その結果,提案したIL-SRDフレームワークは高精度かつエネルギー効率の高いモデルレスランデブーとドッキング制御を実現することがわかった。
ロバストネスの評価は、かなりの未知の乱れの下で競争性能を維持する能力をさらに確認する。
ソースコードはhttps://github.com/Dongzhou-1996/IL-SRDで公開されている。
関連論文リスト
- Lightweight Model Predictive Control for Spacecraft Rendezvous Attitude Synchronization [39.146761527401424]
本研究は、2つの軽量モデル予測制御(MPC)アプローチを導入し、宇宙船のランデブー同期時の反応輪を用いた姿勢追跡を行う。
我々は単一ループとデュアルループMPCを開発し、後者は内部ループ内に安定化フィードバックコントローラを組み込み、線形時間不変システムを生成する。
論文 参考訳(メタデータ) (2026-03-19T13:58:55Z) - Warm-Starting Collision-Free Model Predictive Control With Object-Centric Diffusion [38.363402738466334]
拡散型ウォームスタート条件と潜時オブジェクト中心のシーン表現を組み合わせることで、厳密な時間制限下での信頼性と効率的な動き生成が得られることを示す。
提案手法では,オブジェクト中心のスロットアテンション機構を用いて,システム状態,タスク,周囲に拡散トランスフォーマを設定できる。
サンプル軌道は、剛体力学と符号-距離衝突制約を強制する最適制御問題によって洗練される。
論文 参考訳(メタデータ) (2026-01-06T10:02:54Z) - ScaleWeaver: Weaving Efficient Controllable T2I Generation with Multi-Scale Reference Attention [86.93601565563954]
ScaleWeaverは、高度な視覚的自己回帰(VAR)モデルに基づいて、高忠実で制御可能な生成を実現するために設計されたフレームワークである。
提案された参照注意モジュールは image$rightarrow$condition から不要な注意を排除し、計算コストを削減している。
実験によると、ScaleWeaverは、拡散ベースの方法よりも優れた効率を実現しつつ、高品質な生成と正確な制御を提供する。
論文 参考訳(メタデータ) (2025-10-16T17:00:59Z) - Drift No More? Context Equilibria in Multi-Turn LLM Interactions [58.69551510148673]
コンテキストドリフト(Contexts drift)とは、ターン間のゴール一貫性のある振る舞いからモデルが出力する出力の段階的なばらつきである。
シングルターンエラーとは異なり、ドリフトは時間的に展開し、静的な評価指標では捉えにくい。
マルチターンドリフトは、避けられない崩壊というよりも、制御可能な平衡現象として理解できることを示す。
論文 参考訳(メタデータ) (2025-10-09T04:48:49Z) - ASTREA: Introducing Agentic Intelligence for Orbital Thermal Autonomy [51.56484100374058]
ASTREAは、自律的な宇宙船運用のためのフライト・ヘリテージ・ハードウェア上で実行される最初のエージェント・システムである。
我々は,資源制約付き大規模言語モデル(LLM)エージェントと強化学習コントローラを,空間対応プラットフォームに適した非同期アーキテクチャに統合する。
論文 参考訳(メタデータ) (2025-09-16T08:52:13Z) - Diffusion Predictive Control with Constraints [51.91057765703533]
拡散予測制御(Diffusion predictive control with constraints,DPCC)は、拡散に基づく制御のアルゴリズムである。
DPCCは,新しいテスト時間制約を満たすために,既存の手法よりも優れた性能を示すロボットマニピュレータのシミュレーションを通して示す。
論文 参考訳(メタデータ) (2024-12-12T15:10:22Z) - Constrained Reinforcement Learning using Distributional Representation for Trustworthy Quadrotor UAV Tracking Control [2.325021848829375]
本研究では, 未知の空力効果に対する分散強化学習障害推定器を統合した新しいトラジェクトリトラッカーを提案する。
提案手法は, 空気力学効果の真値と推定値の不確かさを正確に同定する。
本システムは,最近の技術と比較して,累積追尾誤差を少なくとも70%改善することを示した。
論文 参考訳(メタデータ) (2023-02-22T23:15:56Z) - Interpretable Stochastic Model Predictive Control using Distributional
Reinforced Estimation for Quadrotor Tracking Systems [0.8411385346896411]
本研究では,動的・複雑環境下での自律的四角形ナビゲーションのためのトラジェクトリトラッカーを提案する。
提案フレームワークは,未知の空力効果に対する分散強化学習推定器をモデル予測制御器に統合する。
我々は,未知かつ多様な空気力を用いて,累積追従誤差を少なくとも66%改善するシステムを実証した。
論文 参考訳(メタデータ) (2022-05-14T23:27:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。