論文の概要: Low-Thrust Orbital Transfer using Dynamics-Agnostic Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2211.08272v1
- Date: Thu, 6 Oct 2022 08:36:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-23 14:34:18.986218
- Title: Low-Thrust Orbital Transfer using Dynamics-Agnostic Reinforcement
Learning
- Title(参考訳): Dynamics-Agnostic Reinforcement Learning を用いた低推力軌道移動
- Authors: Carlos M. Casas, Belen Carro, and Antonio Sanchez-Esguevillas
- Abstract要約: 本研究では,低推力中軌道衛星を対象としたモデルフリー強化学習を用いてエージェントを訓練する。
訓練されたエージェントは、軌道を設計し、巡航中に衛星を自律的に制御するために使用される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Low-thrust trajectory design and in-flight control remain two of the most
challenging topics for new-generation satellite operations. Most of the
solutions currently implemented are based on reference trajectories and lead to
sub-optimal fuel usage. Other solutions are based on simple guidance laws that
need to be updated periodically, increasing the cost of operations. Whereas
some optimization strategies leverage Artificial Intelligence methods, all of
the approaches studied so far need either previously generated data or a strong
a priori knowledge of the satellite dynamics. This study uses model-free
Reinforcement Learning to train an agent on a constrained pericenter raising
scenario for a low-thrust medium-Earth-orbit satellite. The agent does not have
any prior knowledge of the environment dynamics, which makes it unbiased from
classical trajectory optimization patterns. The trained agent is then used to
design a trajectory and to autonomously control the satellite during the
cruise. Simulations show that a dynamics-agnostic agent is able to learn a
quasi-optimal guidance law and responds well to uncertainties in the
environment dynamics. The results obtained open the door to the usage of
Reinforcement Learning on more complex scenarios, multi-satellite problems, or
to explore trajectories in environments where a reference solution is not known
- Abstract(参考訳): 低推力軌道設計と飛行制御は、新しい世代の衛星運用において最も困難なトピックの1つである。
現在実装されているほとんどのソリューションは、参照軌跡に基づいており、準最適燃料の使用につながる。
他のソリューションは、定期的に更新する必要がある単純なガイダンス法に基づいており、運用コストを増大させる。
一部の最適化戦略が人工知能の手法を利用するのに対して、これまで研究されてきたアプローチはすべて、以前に生成されたデータか、衛星のダイナミクスに関する強力な事前知識を必要とする。
本研究では,低推力中軌道衛星を対象としたモデルフリー強化学習を用いてエージェントを訓練する。
エージェントは環境ダイナミクスに関する事前の知識を持っておらず、古典的な軌道最適化パターンとは疎遠である。
訓練されたエージェントは、コースの設計と、巡航中の衛星の自律制御に使用される。
シミュレーションにより、動的エージェントは準最適誘導法を学習でき、環境力学の不確実性によく対応できることが示された。
その結果,より複雑なシナリオやマルチサテライト問題に対する強化学習の利用,あるいは参照解が不明な環境における軌道探索への扉を開くことができた。
関連論文リスト
- Deep Learning for Trajectory Data Management and Mining: A Survey and Beyond [58.63558696061679]
軌道計算は、位置サービス、都市交通、公共安全など、様々な実用用途において重要である。
トラジェクトリ・コンピューティングのためのディープラーニング(DL4Traj)の開発と最近の進歩について概観する。
特に、軌道計算を増強する可能性を持つ大規模言語モデル(LLM)の最近の進歩をカプセル化する。
論文 参考訳(メタデータ) (2024-03-21T05:57:27Z) - Self-Supervised Class-Agnostic Motion Prediction with Spatial and Temporal Consistency Regularizations [53.797896854533384]
クラスに依存しない動き予測法は点雲全体の動きを直接予測する。
既存のほとんどのメソッドは、完全に教師付き学習に依存しているが、ポイントクラウドデータの手作業によるラベル付けは、手間と時間を要する。
3つの簡単な空間的・時間的正則化損失を導入し,自己指導型学習プロセスの効率化を図る。
論文 参考訳(メタデータ) (2024-03-20T02:58:45Z) - Towards Deviation-Robust Agent Navigation via Perturbation-Aware
Contrastive Learning [125.61772424068903]
視覚言語ナビゲーション(VLN)は、エージェントに与えられた言語命令に従って実際の3D環境をナビゲートするように要求する。
本稿では,既存のVLNエージェントの一般化能力を高めるために,PROPER(Progressive Perturbation-aware Contrastive Learning)と呼ばれるモデルに依存しない学習パラダイムを提案する。
論文 参考訳(メタデータ) (2024-03-09T02:34:13Z) - DTC: Deep Tracking Control [16.2850135844455]
本研究では,両世界の強靭性,フット配置精度,地形の一般化を両世界の利点と組み合わせたハイブリッド制御アーキテクチャを提案する。
深層ニューラルネットワークポリシは、最適化された足場を追跡することを目的として、シミュレーションでトレーニングされている。
モデルベースに比べて滑りやすい地盤や変形可能な地盤が存在する場合の強靭性を示す。
論文 参考訳(メタデータ) (2023-09-27T07:57:37Z) - Learning-based Motion Planning in Dynamic Environments Using GNNs and
Temporal Encoding [15.58317292680615]
組込みとエッジ優先化ポリシの両方を学習するために,データアグリゲーションを用いた時間符号化と模倣学習を用いたGNNベースのアプローチを提案する。
実験により, 提案手法は, 最先端の完全な動的計画アルゴリズムよりも, オンラインプランニングを著しく高速化できることが示された。
論文 参考訳(メタデータ) (2022-10-16T01:27:16Z) - Exploring Dynamic Context for Multi-path Trajectory Prediction [33.66335553588001]
動的コンテキストネットワーク(DCENet)という新しいフレームワークを提案する。
本フレームワークでは,エージェント間の空間的コンテキストを自己注意型アーキテクチャを用いて探索する。
学習した空間的時間的文脈に基づいて、各エージェントに対する将来の軌跡のセットを条件付きで予測する。
論文 参考訳(メタデータ) (2020-10-30T13:39:20Z) - Reinforcement Learning for Low-Thrust Trajectory Design of
Interplanetary Missions [77.34726150561087]
本稿では, 惑星間軌道のロバスト設計における強化学習の適用について検討する。
最先端アルゴリズムのオープンソース実装が採用されている。
その結果得られた誘導制御ネットワークは、堅牢な名目的軌道と関連する閉ループ誘導法の両方を提供する。
論文 参考訳(メタデータ) (2020-08-19T15:22:15Z) - COLREG-Compliant Collision Avoidance for Unmanned Surface Vehicle using
Deep Reinforcement Learning [0.0]
追従と衝突回避は、無人表面船や他の自動運転車にとって、ロボット工学における2つの基本的なガイダンス問題である。
本稿では,連続制御タスクにおける最先端性能を示すDRLアルゴリズムであるPPOの可能性について検討する。
ノルウェー海の入り江であるトロンドハイム・フィヨルド(Trondheim Fjord)の高忠実な標高とAIS追跡データに基づいて、我々は訓練されたエージェントのパフォーマンスを挑戦的でダイナミックな実世界のシナリオで評価した。
論文 参考訳(メタデータ) (2020-06-16T22:05:58Z) - Data Freshness and Energy-Efficient UAV Navigation Optimization: A Deep
Reinforcement Learning Approach [88.45509934702913]
我々は、移動基地局(BS)が配備される複数の無人航空機(UAV)のナビゲーションポリシーを設計する。
我々は、地上BSにおけるデータの鮮度を確保するために、エネルギーや情報年齢(AoI)の制約などの異なる文脈情報を組み込んだ。
提案したトレーニングモデルを適用することで、UAV-BSに対する効果的なリアルタイム軌道ポリシーは、時間とともに観測可能なネットワーク状態をキャプチャする。
論文 参考訳(メタデータ) (2020-02-21T07:29:15Z) - Learning to Move with Affordance Maps [57.198806691838364]
物理的な空間を自律的に探索し、ナビゲートする能力は、事実上あらゆる移動型自律エージェントの基本的な要件である。
従来のSLAMベースの探索とナビゲーションのアプローチは、主にシーン幾何学の活用に重点を置いている。
学習可能な余剰マップは探索と航法の両方において従来のアプローチの強化に利用でき、性能が大幅に向上することを示します。
論文 参考訳(メタデータ) (2020-01-08T04:05:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。