論文の概要: TLE-Based A2C Agent for Terrestrial Coverage Orbital Path Planning
- arxiv url: http://arxiv.org/abs/2508.10872v1
- Date: Thu, 14 Aug 2025 17:44:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-15 22:24:48.436923
- Title: TLE-Based A2C Agent for Terrestrial Coverage Orbital Path Planning
- Title(参考訳): TLE-based A2C Agent for Terrestrial Coverage Orbital Path Planning
- Authors: Anantha Narayanan, Battu Bhanu Teja, Pruthwik Mishra,
- Abstract要約: 低地球軌道(LEO)の混雑は、地球観測衛星の効率的な展開と安全な運用に永続的な課題をもたらす。
本研究では,Advantage Actor-Critic (A2C) アルゴリズムを用いて衛星軌道パラメータを精密な地上被覆のために最適化する強化学習フレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The increasing congestion of Low Earth Orbit (LEO) poses persistent challenges to the efficient deployment and safe operation of Earth observation satellites. Mission planners must now account not only for mission-specific requirements but also for the increasing collision risk with active satellites and space debris. This work presents a reinforcement learning framework using the Advantage Actor-Critic (A2C) algorithm to optimize satellite orbital parameters for precise terrestrial coverage within predefined surface radii. By formulating the problem as a Markov Decision Process (MDP) within a custom OpenAI Gymnasium environment, our method simulates orbital dynamics using classical Keplerian elements. The agent progressively learns to adjust five of the orbital parameters - semi-major axis, eccentricity, inclination, right ascension of ascending node, and the argument of perigee-to achieve targeted terrestrial coverage. Comparative evaluation against Proximal Policy Optimization (PPO) demonstrates A2C's superior performance, achieving 5.8x higher cumulative rewards (10.0 vs 9.263025) while converging in 31.5x fewer timesteps (2,000 vs 63,000). The A2C agent consistently meets mission objectives across diverse target coordinates while maintaining computational efficiency suitable for real-time mission planning applications. Key contributions include: (1) a TLE-based orbital simulation environment incorporating physics constraints, (2) validation of actor-critic methods' superiority over trust region approaches in continuous orbital control, and (3) demonstration of rapid convergence enabling adaptive satellite deployment. This approach establishes reinforcement learning as a computationally efficient alternative for scalable and intelligent LEO mission planning.
- Abstract(参考訳): 低地球軌道(LEO)の混雑は、地球観測衛星の効率的な展開と安全な運用に永続的な課題をもたらす。
ミッションプランナーは、ミッション固有の要求だけでなく、アクティブな衛星や宇宙デブリとの衝突リスクの増加も考慮しなければならない。
本研究は,Advantage Actor-Critic (A2C) アルゴリズムを用いて,衛星軌道パラメータを予め定義された地表半径内での正確な地上被覆のために最適化する強化学習フレームワークを提案する。
独自のOpenAI体育館環境におけるマルコフ決定過程(MDP)としてこの問題を定式化することにより,従来のケプラー要素を用いて軌道力学をシミュレートする。
エージェントは、半大軸、偏心性、傾き、上昇ノードの右上昇、およびターゲット地表面積を達成するためにペリゲーの議論の5つの軌道パラメータを徐々に調整するよう学習する。
PPO(Proximal Policy Optimization)に対する比較評価は、A2Cの優れた性能を示し、5.8倍の累積報酬(10.0対9.263025)を達成し、31.5倍のタイムステップ(2,000対63,000)で収束する。
A2Cエージェントは、リアルタイムのミッション計画アプリケーションに適した計算効率を維持しながら、様々な目標座標をまたいだミッション目標を一貫して満たしている。
主な貢献は,(1)物理制約を取り入れたTLEベースの軌道シミュレーション環境,(2)連続軌道制御における信頼領域アプローチに対するアクター・クリティカルな手法の優位性の検証,(3)適応衛星展開を可能にする迅速な収束の実証などである。
このアプローチは、スケーラブルでインテリジェントなLEOミッション計画の計算効率の良い代替手段として強化学習を確立する。
関連論文リスト
- EarthMapper: Visual Autoregressive Models for Controllable Bidirectional Satellite-Map Translation [50.433911327489554]
制御可能な衛星マップ翻訳のための新しいフレームワークであるEarthMapperを紹介する。
また,中国38都市を対象とした302,132組の衛星マップからなる大規模データセットであるCNSatMapをコントリビュートした。
CNSatMapとNew Yorkデータセットの実験は、EarthMapperの優れたパフォーマンスを実証している。
論文 参考訳(メタデータ) (2025-04-28T02:41:12Z) - OrbitZoo: Multi-Agent Reinforcement Learning Environment for Orbital Dynamics [43.410962336636224]
OrbitZooは、多機能なマルチエージェントRL環境であり、高忠実度業界標準ライブラリ上に構築されている。
衝突回避や協調操作のようなシナリオをサポートし、ロバストで正確な軌道力学を保証する。
実際の衛星星座であるスターリンクに対して検証され、実際のデータと比較すると平均絶対パーセンテージ誤差(MAPE)は0.16%に達する。
論文 参考訳(メタデータ) (2025-04-05T12:44:21Z) - Low-altitude Friendly-Jamming for Satellite-Maritime Communications via Generative AI-enabled Deep Reinforcement Learning [72.72954660774002]
低地球軌道(LEO)衛星は、海上無線通信で広範囲にわたるデータ通信を支援するために使用できる。
LEO衛星を広範囲にカバーし、チャネルの開放性と組み合わせることで、通信プロセスはセキュリティ上のリスクに悩まされる可能性がある。
本稿では無人航空機による低高度衛星通信システムLEOについて述べる。
論文 参考訳(メタデータ) (2025-01-26T10:13:51Z) - On-orbit Servicing for Spacecraft Collision Avoidance With Autonomous Decision Making [0.0]
本研究は、宇宙船衝突回避演習(CAM)を支援するために、AIによるOOSミッションの実装を開発する。
本稿では、RL(Reinforcement Learning)を用いて訓練された自律型サーベイラを提案し、ターゲット衛星と宇宙デブリの衝突を自律的に検出し、絶滅危惧衛星とのランデブーとドッキングを行い、最適なCAMを実行する。
論文 参考訳(メタデータ) (2024-09-25T17:40:37Z) - Revisiting Space Mission Planning: A Reinforcement Learning-Guided Approach for Multi-Debris Rendezvous [15.699822139827916]
目的は、与えられたすべての破片を訪問して、ミッション全体のランデブーを最小限に抑えるシーケンスを最適化することである。
ニューラルネットワーク(NN)ポリシーが開発され、さまざまなデブリフィールドを持つシミュレーションされた宇宙ミッションで訓練される。
強化学習アプローチは計画効率を著しく向上させる。
論文 参考訳(メタデータ) (2024-09-25T12:50:01Z) - A Distance Similarity-based Genetic Optimization Algorithm for Satellite Ground Network Planning Considering Feeding Mode [53.71516191515285]
衛星データ中継ミッションの送信効率の低さは、現在システムの構築を制約している問題となっている。
本研究では,タスク間の状態特性を考慮した距離類似性に基づく遺伝的最適化アルゴリズム(DSGA)を提案し,タスク間の類似性を決定するための重み付きユークリッド距離法を提案する。
論文 参考訳(メタデータ) (2024-08-29T06:57:45Z) - Stitching Satellites to the Edge: Pervasive and Efficient Federated LEO Satellite Learning [1.3121410433987561]
本稿では,衛星が大規模機械学習(ML)タスクを効率的に実行できるようにする新しいFL-SECフレームワークを提案する。
主な構成要素は、余分な衛星画像を特定して排除するディビジョン・アンド・コンカーによるパーソナライズドラーニングと、軌道毎に集約された「軌道モデル」を生成し、地上局に送る前に再訓練する軌道モデル再訓練である。
我々のアプローチではFL収束時間が30倍近く減少し、衛星のエネルギー消費は1.38ワットまで減少し、例外的な精度は96%まで維持される。
論文 参考訳(メタデータ) (2024-01-28T02:01:26Z) - Characterizing Satellite Geometry via Accelerated 3D Gaussian Splatting [0.0]
本稿では,3次元ガウス散乱に基づく軌道上の衛星のマッピング手法を提案する。
ループ型衛星モックアップにおけるモデルトレーニングと3次元レンダリング性能を実演する。
我々のモデルでは、未知の衛星の高品質な新しいビューを、従来のNeRFベースのアルゴリズムよりも2桁近く高速にトレーニングし、レンダリングすることが可能であることが示されている。
論文 参考訳(メタデータ) (2024-01-05T00:49:56Z) - Path Design and Resource Management for NOMA enhanced Indoor Intelligent
Robots [58.980293789967575]
通信可能な屋内知的ロボット(IR)サービスフレームワークを提案する。
室内レイアウトとチャネル状態を決定論的に記述できるレゴモデリング手法が提案されている。
調査対象の無線マップは、強化学習エージェントを訓練するための仮想環境として呼び出される。
論文 参考訳(メタデータ) (2020-11-23T21:45:01Z) - Reinforcement Learning for Low-Thrust Trajectory Design of
Interplanetary Missions [77.34726150561087]
本稿では, 惑星間軌道のロバスト設計における強化学習の適用について検討する。
最先端アルゴリズムのオープンソース実装が採用されている。
その結果得られた誘導制御ネットワークは、堅牢な名目的軌道と関連する閉ループ誘導法の両方を提供する。
論文 参考訳(メタデータ) (2020-08-19T15:22:15Z) - Integrating LEO Satellite and UAV Relaying via Reinforcement Learning
for Non-Terrestrial Networks [51.05735925326235]
低軌道軌道(LEO)衛星のメガコンステレーションは、低レイテンシで長距離通信を可能にする可能性がある。
軌道上の星座から選択されたLEO衛星を用いて、2つの遠距離地上端末間でパケットを転送する問題について検討する。
エンドツーエンドのデータレートを最大化するためには、衛星アソシエーションとHAPロケーションを最適化する必要がある。
本稿では, 深部強化学習(DRL)と新しい動作次元低減技術を用いてこの問題に対処する。
論文 参考訳(メタデータ) (2020-05-26T05:39:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。