Fugu-MT 論文翻訳(概要): TLE-Based A2C Agent for Terrestrial Coverage Orbital Path Planning

論文の概要: TLE-Based A2C Agent for Terrestrial Coverage Orbital Path Planning

arxiv url: http://arxiv.org/abs/2508.10872v1
Date: Thu, 14 Aug 2025 17:44:51 GMT
ステータス: 翻訳完了
システム内更新日: 2025-08-15 22:24:48.436923
Title: TLE-Based A2C Agent for Terrestrial Coverage Orbital Path Planning
Title（参考訳）: TLE-based A2C Agent for Terrestrial Coverage Orbital Path Planning
Authors: Anantha Narayanan, Battu Bhanu Teja, Pruthwik Mishra,
Abstract要約: 低地球軌道(LEO)の混雑は、地球観測衛星の効率的な展開と安全な運用に永続的な課題をもたらす。本研究では,Advantage Actor-Critic (A2C) アルゴリズムを用いて衛星軌道パラメータを精密な地上被覆のために最適化する強化学習フレームワークを提案する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The increasing congestion of Low Earth Orbit (LEO) poses persistent challenges to the efficient deployment and safe operation of Earth observation satellites. Mission planners must now account not only for mission-specific requirements but also for the increasing collision risk with active satellites and space debris. This work presents a reinforcement learning framework using the Advantage Actor-Critic (A2C) algorithm to optimize satellite orbital parameters for precise terrestrial coverage within predefined surface radii. By formulating the problem as a Markov Decision Process (MDP) within a custom OpenAI Gymnasium environment, our method simulates orbital dynamics using classical Keplerian elements. The agent progressively learns to adjust five of the orbital parameters - semi-major axis, eccentricity, inclination, right ascension of ascending node, and the argument of perigee-to achieve targeted terrestrial coverage. Comparative evaluation against Proximal Policy Optimization (PPO) demonstrates A2C's superior performance, achieving 5.8x higher cumulative rewards (10.0 vs 9.263025) while converging in 31.5x fewer timesteps (2,000 vs 63,000). The A2C agent consistently meets mission objectives across diverse target coordinates while maintaining computational efficiency suitable for real-time mission planning applications. Key contributions include: (1) a TLE-based orbital simulation environment incorporating physics constraints, (2) validation of actor-critic methods' superiority over trust region approaches in continuous orbital control, and (3) demonstration of rapid convergence enabling adaptive satellite deployment. This approach establishes reinforcement learning as a computationally efficient alternative for scalable and intelligent LEO mission planning.
Abstract（参考訳）: 低地球軌道(LEO)の混雑は、地球観測衛星の効率的な展開と安全な運用に永続的な課題をもたらす。ミッションプランナーは、ミッション固有の要求だけでなく、アクティブな衛星や宇宙デブリとの衝突リスクの増加も考慮しなければならない。本研究は,Advantage Actor-Critic (A2C) アルゴリズムを用いて,衛星軌道パラメータを予め定義された地表半径内での正確な地上被覆のために最適化する強化学習フレームワークを提案する。独自のOpenAI体育館環境におけるマルコフ決定過程(MDP)としてこの問題を定式化することにより,従来のケプラー要素を用いて軌道力学をシミュレートする。エージェントは、半大軸、偏心性、傾き、上昇ノードの右上昇、およびターゲット地表面積を達成するためにペリゲーの議論の5つの軌道パラメータを徐々に調整するよう学習する。 PPO(Proximal Policy Optimization)に対する比較評価は、A2Cの優れた性能を示し、5.8倍の累積報酬(10.0対9.263025)を達成し、31.5倍のタイムステップ(2,000対63,000)で収束する。 A2Cエージェントは、リアルタイムのミッション計画アプリケーションに適した計算効率を維持しながら、様々な目標座標をまたいだミッション目標を一貫して満たしている。主な貢献は,(1)物理制約を取り入れたTLEベースの軌道シミュレーション環境,(2)連続軌道制御における信頼領域アプローチに対するアクター・クリティカルな手法の優位性の検証,(3)適応衛星展開を可能にする迅速な収束の実証などである。このアプローチは、スケーラブルでインテリジェントなLEOミッション計画の計算効率の良い代替手段として強化学習を確立する。

関連論文リスト

Optimal Multi-Debris Mission Planning in LEO: A Deep Reinforcement Learning Approach with Co-Elliptic Transfers and Refueling [22.261628532402067]
本稿では, ホフマン転移, 安全近接操作, 明示的再給油論理を組み合わせた統合型楕円型操舵フレームワークを提案する。我々は、Greedy、Monte Carlo Tree Search(MCTS)、Deep reinforcement Learning(RL)の3つの異なる計画アルゴリズムをベンチマークする。 100以上のテストシナリオの実験結果から,Masked PPOはミッション効率と計算性能に優れることが示された。
論文参考訳（メタデータ） (2026-02-04T22:15:14Z)
Optimizing Mission Planning for Multi-Debris Rendezvous Using Reinforcement Learning with Refueling and Adaptive Collision Avoidance [22.261628532402067]
本研究では, アクティブデブリ除去ミッションにおける適応衝突回避のための強化学習に基づく枠組みを提案する。小型衛星は、柔軟性、コスト効率、操縦性から採用され、ADRのようなダイナミックなミッションに適している。このフレームワークは、補給戦略、効率的なミッション計画、適応衝突回避を統合し、宇宙船のランデブー操作を最適化する。
論文参考訳（メタデータ） (2026-02-04T21:49:20Z)
Bringing Federated Learning to Space [3.058685580689604]
Federated Learningは、衛星ネットワーク間で協調的なモデルトレーニングを行うための、有望なフレームワークを提供する。我々は、地球上のアルゴリズムを軌道制約下での動作に適応させる包括的「宇宙化」フレームワークを導入する。解析により、宇宙適応FLアルゴリズムは、最大100個の衛星の星座に効率よくスケールできることが示されている。
論文参考訳（メタデータ） (2025-11-18T20:16:07Z)
Multi-Agent Reinforcement Learning for Heterogeneous Satellite Cluster Resources Optimization [19.16014340215772]
2つの光学衛星と1つのSAR衛星が低軌道で協力して地上の目標を捕捉し、その限られた資源を効率的に管理する。従来の最適化手法は、地球観測(EO)のリアルタイム、不確実、分散的な性質を扱うのに苦労している。本研究では,単一サテライトから多サテライトシナリオへの最適化問題を体系的に定式化する。 Basilisk と BSK-RL フレームワーク上に構築された準現実的なシミュレーション環境を用いて,最先端の MARL アルゴリズムの性能と安定性を評価する。
論文参考訳（メタデータ） (2025-11-16T21:47:04Z)
STRIDER: Navigation via Instruction-Aligned Structural Decision Space Optimization [73.98141357780032]
VLN-CEタスクでは、エージェントはシーン固有のトレーニングなしで自然言語命令を使用して3D環境をナビゲートする必要がある。既存の方法は、構造化された意思決定の欠如と、以前の行動からのフィードバックの不十分な統合のために、堅牢なナビゲーションを達成できないことが多い。 STRIDERは,空間配置先と動的タスクフィードバックを統合し,エージェントの決定空間を体系的に最適化する新しいフレームワークである。提案手法では,1)空間構造を介して行動空間を制約する構造的ウェイポイントジェネレータ,2)タスクの進行に応じて行動を調整するタスク調整レギュレータ,そしてナビゲーション全体を通して意味的アライメントを確保する。
論文参考訳（メタデータ） (2025-10-27T04:37:21Z)
InternVLA-M1: A Spatially Guided Vision-Language-Action Framework for Generalist Robot Policy [138.89177083578213]
空間接地とロボット制御のための統合フレームワークであるInternVLA-M1を紹介する。 InternVLA-M1は、(i)2.3M以上の空間的推論データに基づく空間的グラウンドトレーニングと(ii)空間的に誘導された後トレーニングという、2段階のパイプラインを使用する。結果: InternVLA-M1 は SimplerEnv Google Robot で+14.6%、WidowX で+17%、LIBERO Franka で+4.3% で、空間誘導なしでその変種を上回った。
論文参考訳（メタデータ） (2025-10-15T17:30:05Z)
ASTREA: Introducing Agentic Intelligence for Orbital Thermal Autonomy [51.56484100374058]
ASTREAは、自律的な宇宙船運用のためのフライト・ヘリテージ・ハードウェア上で実行される最初のエージェント・システムである。我々は,資源制約付き大規模言語モデル(LLM)エージェントと強化学習コントローラを,空間対応プラットフォームに適した非同期アーキテクチャに統合する。
論文参考訳（メタデータ） (2025-09-16T08:52:13Z)
Joint AoI and Handover Optimization in Space-Air-Ground Integrated Network [48.485907216785904]
ローアース軌道(LEO)衛星コンステレーションは、地球をカバーし、遅延を減少させる有望な解決策を提供する。しかし、軌道力学による間欠的カバレッジと間欠的な通信窓に苦しむ。我々の3層設計では、HAP-地上通信のための高容量衛星間通信と信頼性無線周波数(RF)リンクに、ハイブリッド自由空間光(FSO)リンクを用いる。
論文参考訳（メタデータ） (2025-09-16T06:16:56Z)
EarthMapper: Visual Autoregressive Models for Controllable Bidirectional Satellite-Map Translation [50.433911327489554]
制御可能な衛星マップ翻訳のための新しいフレームワークであるEarthMapperを紹介する。また,中国38都市を対象とした302,132組の衛星マップからなる大規模データセットであるCNSatMapをコントリビュートした。 CNSatMapとNew Yorkデータセットの実験は、EarthMapperの優れたパフォーマンスを実証している。
論文参考訳（メタデータ） (2025-04-28T02:41:12Z)
OrbitZoo: Multi-Agent Reinforcement Learning Environment for Orbital Dynamics [43.410962336636224]
OrbitZooは、多機能なマルチエージェントRL環境であり、高忠実度業界標準ライブラリ上に構築されている。衝突回避や協調操作のようなシナリオをサポートし、ロバストで正確な軌道力学を保証する。実際の衛星星座であるスターリンクに対して検証され、実際のデータと比較すると平均絶対パーセンテージ誤差(MAPE)は0.16%に達する。
論文参考訳（メタデータ） (2025-04-05T12:44:21Z)
Low-altitude Friendly-Jamming for Satellite-Maritime Communications via Generative AI-enabled Deep Reinforcement Learning [72.72954660774002]
低地球軌道(LEO)衛星は、海上無線通信で広範囲にわたるデータ通信を支援するために使用できる。 LEO衛星を広範囲にカバーし、チャネルの開放性と組み合わせることで、通信プロセスはセキュリティ上のリスクに悩まされる可能性がある。本稿では無人航空機による低高度衛星通信システムLEOについて述べる。
論文参考訳（メタデータ） (2025-01-26T10:13:51Z)
On-orbit Servicing for Spacecraft Collision Avoidance With Autonomous Decision Making [0.0]
本研究は、宇宙船衝突回避演習(CAM)を支援するために、AIによるOOSミッションの実装を開発する。本稿では、RL(Reinforcement Learning)を用いて訓練された自律型サーベイラを提案し、ターゲット衛星と宇宙デブリの衝突を自律的に検出し、絶滅危惧衛星とのランデブーとドッキングを行い、最適なCAMを実行する。
論文参考訳（メタデータ） (2024-09-25T17:40:37Z)
Revisiting Space Mission Planning: A Reinforcement Learning-Guided Approach for Multi-Debris Rendezvous [15.699822139827916]
目的は、与えられたすべての破片を訪問して、ミッション全体のランデブーを最小限に抑えるシーケンスを最適化することである。ニューラルネットワーク(NN)ポリシーが開発され、さまざまなデブリフィールドを持つシミュレーションされた宇宙ミッションで訓練される。強化学習アプローチは計画効率を著しく向上させる。
論文参考訳（メタデータ） (2024-09-25T12:50:01Z)
A Distance Similarity-based Genetic Optimization Algorithm for Satellite Ground Network Planning Considering Feeding Mode [53.71516191515285]
衛星データ中継ミッションの送信効率の低さは、現在システムの構築を制約している問題となっている。本研究では,タスク間の状態特性を考慮した距離類似性に基づく遺伝的最適化アルゴリズム(DSGA)を提案し,タスク間の類似性を決定するための重み付きユークリッド距離法を提案する。
論文参考訳（メタデータ） (2024-08-29T06:57:45Z)
Stitching Satellites to the Edge: Pervasive and Efficient Federated LEO Satellite Learning [1.3121410433987561]
本稿では,衛星が大規模機械学習(ML)タスクを効率的に実行できるようにする新しいFL-SECフレームワークを提案する。主な構成要素は、余分な衛星画像を特定して排除するディビジョン・アンド・コンカーによるパーソナライズドラーニングと、軌道毎に集約された「軌道モデル」を生成し、地上局に送る前に再訓練する軌道モデル再訓練である。我々のアプローチではFL収束時間が30倍近く減少し、衛星のエネルギー消費は1.38ワットまで減少し、例外的な精度は96%まで維持される。
論文参考訳（メタデータ） (2024-01-28T02:01:26Z)
Characterizing Satellite Geometry via Accelerated 3D Gaussian Splatting [0.0]
本稿では,3次元ガウス散乱に基づく軌道上の衛星のマッピング手法を提案する。ループ型衛星モックアップにおけるモデルトレーニングと3次元レンダリング性能を実演する。我々のモデルでは、未知の衛星の高品質な新しいビューを、従来のNeRFベースのアルゴリズムよりも2桁近く高速にトレーニングし、レンダリングすることが可能であることが示されている。
論文参考訳（メタデータ） (2024-01-05T00:49:56Z)
Path Design and Resource Management for NOMA enhanced Indoor Intelligent Robots [58.980293789967575]
通信可能な屋内知的ロボット(IR)サービスフレームワークを提案する。室内レイアウトとチャネル状態を決定論的に記述できるレゴモデリング手法が提案されている。調査対象の無線マップは、強化学習エージェントを訓練するための仮想環境として呼び出される。
論文参考訳（メタデータ） (2020-11-23T21:45:01Z)
Reinforcement Learning for Low-Thrust Trajectory Design of Interplanetary Missions [77.34726150561087]
本稿では, 惑星間軌道のロバスト設計における強化学習の適用について検討する。最先端アルゴリズムのオープンソース実装が採用されている。その結果得られた誘導制御ネットワークは、堅牢な名目的軌道と関連する閉ループ誘導法の両方を提供する。
論文参考訳（メタデータ） (2020-08-19T15:22:15Z)
Integrating LEO Satellite and UAV Relaying via Reinforcement Learning for Non-Terrestrial Networks [51.05735925326235]
低軌道軌道(LEO)衛星のメガコンステレーションは、低レイテンシで長距離通信を可能にする可能性がある。軌道上の星座から選択されたLEO衛星を用いて、2つの遠距離地上端末間でパケットを転送する問題について検討する。エンドツーエンドのデータレートを最大化するためには、衛星アソシエーションとHAPロケーションを最適化する必要がある。本稿では, 深部強化学習(DRL)と新しい動作次元低減技術を用いてこの問題に対処する。
論文参考訳（メタデータ） (2020-05-26T05:39:27Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。