論文の概要: Deep Learning Warm Starts for Trajectory Optimization on the International Space Station
- arxiv url: http://arxiv.org/abs/2505.05588v2
- Date: Wed, 13 Aug 2025 01:24:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-14 20:42:00.516451
- Title: Deep Learning Warm Starts for Trajectory Optimization on the International Space Station
- Title(参考訳): 宇宙ステーションにおける軌道最適化のための深層学習ワーム
- Authors: Somrita Banerjee, Abhishek Cauligi, Marco Pavone,
- Abstract要約: 軌道最適化は現代の自律ロボットの基盤であり、システムは安全と物理的制約を尊重しながら、軌道と制御をリアルタイムで計算することができる。
国際宇宙ステーション(ISS)のアストローブ自由飛行ロボットの軌道最適化を加速するために、機械学習によるウォームスタートを用いた最初の飛行実験結果を提供する。
このトレーニングされたニューラルネットワークは、軌道生成問題の解決策を予測し、SCPソルバを使用してシステムの安全性制約を強制する。
- 参考スコア(独自算出の注目度): 17.306347323545985
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Trajectory optimization is a cornerstone of modern robot autonomy, enabling systems to compute trajectories and controls in real-time while respecting safety and physical constraints. However, it has seen limited usage in spaceflight applications due to its heavy computational demands that exceed the capability of most flight computers. In this work, we provide results on the first flight demonstration of using machine learning-based warm starts for accelerating trajectory optimization for the Astrobee free-flying robot on-board the International Space Station (ISS). We formulate a data-driven optimal control approach that trains a neural network to learn the structure of the trajectory generation problem being solved for by sequential convex programming (SCP). On-board, this trained neural network predicts solutions for the trajectory generation problem and relies on using the SCP solver to enforce safety constraints for the system. Our trained network reduces the number of solver iterations required for convergence in cases including rotational dynamics by 60% and in cases with obstacles drawn from the training distribution of the warm start model by 50%. This work represents a significant milestone in the use of learning-based control for spaceflight applications and a stepping stone for future advances in the use of machine learning for autonomous guidance, navigation, & control.
- Abstract(参考訳): 軌道最適化は現代の自律ロボットの基盤であり、システムは安全と物理的制約を尊重しながら、軌道と制御をリアルタイムで計算することができる。
しかし、ほとんどの飛行コンピュータの能力を超える計算要求のために、宇宙飛行の用途での使用は限られている。
本研究では,国際宇宙ステーション(ISS)に搭載されたアストローブ自由飛行ロボットの軌道最適化を加速するために,機械学習に基づくウォームスタートを用いた最初の飛行実験結果について述べる。
本研究では、連続凸プログラミング(SCP)により解決される軌道生成問題の構造を学習するために、ニューラルネットワークを訓練するデータ駆動最適制御手法を定式化する。
このトレーニングされたニューラルネットワークは、軌道生成問題の解決策を予測し、SCPソルバを使用してシステムの安全性制約を強制する。
トレーニングされたネットワークは、回転力学を含む収束に必要な解の繰り返し回数を60%減らし、温暖化開始モデルのトレーニング分布から引き出された障害物を50%減らした。
この研究は、宇宙飛行アプリケーションにおける学習ベースの制御の利用における重要なマイルストーンであり、自律的な誘導、ナビゲーション、制御に機械学習を使用することの今後の進歩の足掛かりである。
関連論文リスト
- DRL-based Dolph-Tschebyscheff Beamforming in Downlink Transmission for Mobile Users [52.9870460238443]
学習可能なDolph-Tschebyscheffアンテナアレイを用いた深部強化学習に基づくブラインドビームフォーミング手法を提案する。
シミュレーションの結果,提案手法は最良値に非常に近いデータレートをサポートできることが示唆された。
論文 参考訳(メタデータ) (2025-02-03T11:50:43Z) - Space for Improvement: Navigating the Design Space for Federated Learning in Satellite Constellations [0.8437187555622164]
衛星コンステレーションの設計とハードウェア対応テストプラットフォームであるFLySTacKを用いて,既存のFLアルゴリズムの空間化手法を開発した。
我々はAutoFLSatを紹介した。これは空間に対する一般化された階層的な自律的FLアルゴリズムであり、主要な代替手段よりも12.5%から37.5%のモデルトレーニング時間を短縮する。
論文 参考訳(メタデータ) (2024-10-31T23:49:36Z) - Learning-Initialized Trajectory Planning in Unknown Environments [4.2960463890487555]
未知の環境での自律飛行の計画には、空間軌道と時間軌道の両方を正確に計画する必要がある。
本稿ではニューラルdトラジェクトリ・プランナーを用いて最適化を導く新しい手法を提案する。
遅延計画に対する耐性を持って、堅牢なオンラインリプランニングをサポートするフレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-19T15:07:26Z) - Confidence-Controlled Exploration: Efficient Sparse-Reward Policy Learning for Robot Navigation [72.24964965882783]
強化学習(RL)はロボットナビゲーションにおいて有望なアプローチであり、ロボットは試行錯誤を通じて学習することができる。
現実世界のロボットタスクは、しばしばまばらな報酬に悩まされ、非効率な探索と準最適政策に繋がる。
本稿では,RLに基づくロボットナビゲーションにおいて,報酬関数を変更せずにサンプル効率を向上させる新しい手法であるConfidence-Controlled Exploration (CCE)を紹介する。
論文 参考訳(メタデータ) (2023-06-09T18:45:15Z) - Optimality Principles in Spacecraft Neural Guidance and Control [16.59877059263942]
我々は、エンドツーエンドの神経誘導と制御アーキテクチャ(以下、G&CNetと呼ばれる)は、最適な原則に従って行動することの重荷をオンボードで転送できると主張している。
このようにして、センサー情報はリアルタイムで最適な計画に変換され、ミッションの自律性と堅牢性が向上する。
本稿では、惑星間移動、着陸、近接操作のシミュレーションにおいて、そのようなニューラルネットワークのトレーニングにおいて得られた主な成果について論じる。
論文 参考訳(メタデータ) (2023-05-22T14:48:58Z) - Gradient-Based Trajectory Optimization With Learned Dynamics [80.41791191022139]
データからシステムの微分可能なダイナミクスモデルを学習するために、機械学習技術を使用します。
ニューラルネットワークは、大規模な時間的地平線に対して、非常に非線形な振る舞いを正確にモデル化できることが示される。
ハードウェア実験において、学習したモデルがSpotとRadio- controlled (RC)の両方の複雑な力学を表現できることを実証した。
論文 参考訳(メタデータ) (2022-04-09T22:07:34Z) - Bayesian Optimization and Deep Learning forsteering wheel angle
prediction [58.720142291102135]
本研究の目的は,自動走行システムにおける操舵角度予測の精度の高いモデルを得ることである。
BOは限られた試行数で、BOST-LSTMと呼ばれるモデルを特定し、古典的なエンドツーエンド駆動モデルと比較して最も正確な結果を得た。
論文 参考訳(メタデータ) (2021-10-22T15:25:14Z) - Time-Optimal Planning for Quadrotor Waypoint Flight [50.016821506107455]
立方体の作動限界における時間-最適軌道の計画は未解決の問題である。
四重項のアクチュエータポテンシャルをフル活用する解を提案する。
我々は、世界最大規模のモーションキャプチャーシステムにおいて、実世界の飛行における我々の方法を検証する。
論文 参考訳(メタデータ) (2021-08-10T09:26:43Z) - Reinforcement Learning for Low-Thrust Trajectory Design of
Interplanetary Missions [77.34726150561087]
本稿では, 惑星間軌道のロバスト設計における強化学習の適用について検討する。
最先端アルゴリズムのオープンソース実装が採用されている。
その結果得られた誘導制御ネットワークは、堅牢な名目的軌道と関連する閉ループ誘導法の両方を提供する。
論文 参考訳(メタデータ) (2020-08-19T15:22:15Z) - First Steps: Latent-Space Control with Semantic Constraints for
Quadruped Locomotion [73.37945453998134]
従来の四重化制御のアプローチでは、単純化された手作りのモデルが採用されている。
これにより、有効な運動範囲が縮小されているため、ロボットの能力が大幅に低下する。
この研究において、これらの課題は、構造化潜在空間における最適化として四重化制御をフレーミングすることによって解決される。
深い生成モデルは、実現可能な関節構成の統計的表現を捉え、一方、複雑な動的および終端的制約は高レベルな意味的指標によって表現される。
実世界とシミュレーションの両方で最適化された移動軌跡の実現可能性を検証する。
論文 参考訳(メタデータ) (2020-07-03T07:04:18Z) - Real-Time Optimal Guidance and Control for Interplanetary Transfers
Using Deep Networks [10.191757341020216]
最適な例の模倣学習は、ネットワークトレーニングパラダイムとして使用される。
G&CNETは、宇宙船の最適誘導制御システムの実装をオンボードでリアルタイムに行うのに適している。
論文 参考訳(メタデータ) (2020-02-20T23:37:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。