論文の概要: Real-Time Optimal Guidance and Control for Interplanetary Transfers
Using Deep Networks
- arxiv url: http://arxiv.org/abs/2002.09063v1
- Date: Thu, 20 Feb 2020 23:37:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-30 07:44:01.118517
- Title: Real-Time Optimal Guidance and Control for Interplanetary Transfers
Using Deep Networks
- Title(参考訳): ディープネットワークを用いた惑星間移動のリアルタイム最適誘導と制御
- Authors: Dario Izzo and Ekin \"Ozt\"urk
- Abstract要約: 最適な例の模倣学習は、ネットワークトレーニングパラダイムとして使用される。
G&CNETは、宇宙船の最適誘導制御システムの実装をオンボードでリアルタイムに行うのに適している。
- 参考スコア(独自算出の注目度): 10.191757341020216
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider the Earth-Venus mass-optimal interplanetary transfer of a
low-thrust spacecraft and show how the optimal guidance can be represented by
deep networks in a large portion of the state space and to a high degree of
accuracy. Imitation (supervised) learning of optimal examples is used as a
network training paradigm. The resulting models are suitable for an on-board,
real-time, implementation of the optimal guidance and control system of the
spacecraft and are called G&CNETs. A new general methodology called Backward
Generation of Optimal Examples is introduced and shown to be able to
efficiently create all the optimal state action pairs necessary to train
G&CNETs without solving optimal control problems. With respect to previous
works, we are able to produce datasets containing a few orders of magnitude
more optimal trajectories and obtain network performances compatible with real
missions requirements. Several schemes able to train representations of either
the optimal policy (thrust profile) or the value function (optimal mass) are
proposed and tested. We find that both policy learning and value function
learning successfully and accurately learn the optimal thrust and that a
spacecraft employing the learned thrust is able to reach the target conditions
orbit spending only 2 permil more propellant than in the corresponding
mathematically optimal transfer. Moreover, the optimal propellant mass can be
predicted (in case of value function learning) within an error well within 1%.
All G&CNETs produced are tested during simulations of interplanetary transfers
with respect to their ability to reach the target conditions optimally starting
from nominal and off-nominal conditions.
- Abstract(参考訳): 我々は、低推力宇宙船の地球-金星質量-最適惑星間移動を考察し、状態空間の大部分と高い精度で、どのように最適な誘導を深層ネットワークで表現できるかを示す。
最適例の模倣(教師付き)学習は、ネットワークトレーニングパラダイムとして使用される。
得られたモデルは、宇宙船の最適誘導制御システムの実装をオンボードでリアルタイムに行うのに適したもので、G&CNETと呼ばれる。
Backward Generation of Optimal Examplesと呼ばれる新しい一般的な手法を導入し、最適制御問題を解くことなく、G&CNETのトレーニングに必要な全ての最適な状態アクションペアを効率的に作成できることを示した。
これまでの研究では、数桁の最適な軌道を含むデータセットを作成でき、実際のミッション要求に適合するネットワーク性能を得ることができる。
最適ポリシー(スラストプロファイル)または値関数(最適質量)の表現を訓練できるいくつかのスキームを提案しテストした。
方針学習と価値関数学習の両方が最適推力の学習を成功かつ正確に行い、学習された推力を用いた宇宙船は、対応する数学的な最適推力よりも2パーミルの推進剤しか消費しない目標条件に到達できることを見出した。
さらに、最適な推進剤質量は1%以内の誤差で予測できる(値関数学習の場合)。
全てのG&CNETは、惑星間移動のシミュレーション中に、名目上および外部の条件から最適に目標条件に到達する能力について試験される。
関連論文リスト
- Towards Robust Spacecraft Trajectory Optimization via Transformers [17.073280827888226]
将来の多機のミッションでは、安全かつ効率的なランデブー操作を確保するために、堅牢な自律的な最適化機能が必要である。
この負担を軽減するため、生成トランスフォーマーモデルを導入し、ロバストな最適初期推定を提供する。
この研究はARTの機能を拡張し、堅牢な制約付き最適制御問題に対処する。
論文 参考訳(メタデータ) (2024-10-08T00:58:42Z) - Hallmarks of Optimization Trajectories in Neural Networks: Directional Exploration and Redundancy [75.15685966213832]
最適化トラジェクトリのリッチな方向構造をポイントワイズパラメータで解析する。
トレーニング中のスカラーバッチノルムパラメータは,ネットワーク全体のトレーニング性能と一致していることを示す。
論文 参考訳(メタデータ) (2024-03-12T07:32:47Z) - Learning Regions of Interest for Bayesian Optimization with Adaptive
Level-Set Estimation [84.0621253654014]
本稿では,高信頼領域を適応的にフィルタするBALLETというフレームワークを提案する。
理論的には、BALLETは探索空間を効率的に縮小することができ、標準BOよりも厳密な後悔を示すことができる。
論文 参考訳(メタデータ) (2023-07-25T09:45:47Z) - Optimality Principles in Spacecraft Neural Guidance and Control [16.59877059263942]
我々は、エンドツーエンドの神経誘導と制御アーキテクチャ(以下、G&CNetと呼ばれる)は、最適な原則に従って行動することの重荷をオンボードで転送できると主張している。
このようにして、センサー情報はリアルタイムで最適な計画に変換され、ミッションの自律性と堅牢性が向上する。
本稿では、惑星間移動、着陸、近接操作のシミュレーションにおいて、そのようなニューラルネットワークのトレーニングにおいて得られた主な成果について論じる。
論文 参考訳(メタデータ) (2023-05-22T14:48:58Z) - Gradient-Based Trajectory Optimization With Learned Dynamics [80.41791191022139]
データからシステムの微分可能なダイナミクスモデルを学習するために、機械学習技術を使用します。
ニューラルネットワークは、大規模な時間的地平線に対して、非常に非線形な振る舞いを正確にモデル化できることが示される。
ハードウェア実験において、学習したモデルがSpotとRadio- controlled (RC)の両方の複雑な力学を表現できることを実証した。
論文 参考訳(メタデータ) (2022-04-09T22:07:34Z) - Neural representation of a time optimal, constant acceleration
rendezvous [10.191757341020216]
我々は、最適政策(すなわち最適な推力方向)と値関数(すなわち飛行時間)の両方を表現するために、時間最適で一定加速度の低推力ランデブーをニューラルネットワークで訓練する。
あらゆるケースにおいて、アキュラシーはランデブーと飛行予測の時間に成功する。
論文 参考訳(メタデータ) (2022-03-29T12:40:50Z) - Bayesian Optimization and Deep Learning forsteering wheel angle
prediction [58.720142291102135]
本研究の目的は,自動走行システムにおける操舵角度予測の精度の高いモデルを得ることである。
BOは限られた試行数で、BOST-LSTMと呼ばれるモデルを特定し、古典的なエンドツーエンド駆動モデルと比較して最も正確な結果を得た。
論文 参考訳(メタデータ) (2021-10-22T15:25:14Z) - Reinforcement Learning for Low-Thrust Trajectory Design of
Interplanetary Missions [77.34726150561087]
本稿では, 惑星間軌道のロバスト設計における強化学習の適用について検討する。
最先端アルゴリズムのオープンソース実装が採用されている。
その結果得られた誘導制御ネットワークは、堅牢な名目的軌道と関連する閉ループ誘導法の両方を提供する。
論文 参考訳(メタデータ) (2020-08-19T15:22:15Z) - Localized active learning of Gaussian process state space models [63.97366815968177]
多くの共通制御アプリケーションにおいて、優れた性能を達成するためには、グローバルに正確なモデルを必要としない。
本稿では,状態-作用空間の有界部分集合上の正確なモデルを得ることを目的としたガウス過程状態空間モデルに対する能動的学習戦略を提案する。
モデル予測制御を用いることで、探索中に収集した情報を統合し、探索戦略を適応的に改善する。
論文 参考訳(メタデータ) (2020-05-04T05:35:02Z) - Reinforcement Meta-Learning for Interception of Maneuvering
Exoatmospheric Targets with Parasitic Attitude Loop [1.7663909228482466]
我々は強化メタラーニング(Reinforcement Meta-Learning)を用いて、運動目標の対空干渉に適した適応型統合誘導、ナビゲーション、制御システムを最適化する。
このシステムは、ストラップダウン・シーカー角と速度ジャイロによる観測を、スラスタのオンオフコマンドに直接マッピングする。
最適化されたポリシーは、探索角度測定ラグ、スラスタ制御ラグ、スケールファクタエラーによる寄生姿勢ループ、角度および回転速度測定におけるガウスノイズなどの寄生効果に適応できることを実証した。
論文 参考訳(メタデータ) (2020-04-18T21:20:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。