論文の概要: Spacecraft Autonomous Decision-Planning for Collision Avoidance: a
Reinforcement Learning Approach
- arxiv url: http://arxiv.org/abs/2310.18966v1
- Date: Sun, 29 Oct 2023 10:15:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-31 15:17:52.755234
- Title: Spacecraft Autonomous Decision-Planning for Collision Avoidance: a
Reinforcement Learning Approach
- Title(参考訳): 衝突回避のための宇宙船自律的意思決定計画--強化学習アプローチ
- Authors: Nicolas Bourriez, Adrien Loizeau and Adam F. Abdin
- Abstract要約: 本研究は、強化学習技術に基づく宇宙船における自律的なCA意思決定機能の実装を提案する。
提案フレームワークは,軌道上の破片の状態を不完全な監視し,正確な衝突回避策(CAM)を実行するためのポリシーをAIシステムが効果的に学習できるようにする。
目的は、CAMを自律的に実施するための意思決定プロセスを、人間の介入なしに宇宙船に委譲することである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The space environment around the Earth is becoming increasingly populated by
both active spacecraft and space debris. To avoid potential collision events,
significant improvements in Space Situational Awareness (SSA) activities and
Collision Avoidance (CA) technologies are allowing the tracking and maneuvering
of spacecraft with increasing accuracy and reliability. However, these
procedures still largely involve a high level of human intervention to make the
necessary decisions. For an increasingly complex space environment, this
decision-making strategy is not likely to be sustainable. Therefore, it is
important to successfully introduce higher levels of automation for key Space
Traffic Management (STM) processes to ensure the level of reliability needed
for navigating a large number of spacecraft. These processes range from
collision risk detection to the identification of the appropriate action to
take and the execution of avoidance maneuvers. This work proposes an
implementation of autonomous CA decision-making capabilities on spacecraft
based on Reinforcement Learning (RL) techniques. A novel methodology based on a
Partially Observable Markov Decision Process (POMDP) framework is developed to
train the Artificial Intelligence (AI) system on board the spacecraft,
considering epistemic and aleatory uncertainties. The proposed framework
considers imperfect monitoring information about the status of the debris in
orbit and allows the AI system to effectively learn stochastic policies to
perform accurate Collision Avoidance Maneuvers (CAMs). The objective is to
successfully delegate the decision-making process for autonomously implementing
a CAM to the spacecraft without human intervention. This approach would allow
for a faster response in the decision-making process and for highly
decentralized operations.
- Abstract(参考訳): 地球周辺の宇宙環境は、アクティブな宇宙船と宇宙デブリの両方で人口が増えつつある。
衝突の可能性を避けるため、宇宙状況認識(SSA)活動と衝突回避(CA)技術が大幅に改善され、精度と信頼性が向上した宇宙船の追跡と操縦が可能になった。
しかし、これらの手順は依然として、必要な決定を行うための高いレベルの人間の介入を伴っている。
ますます複雑な宇宙環境において、この意思決定戦略は持続可能ではない。
したがって、多くの宇宙船の航行に必要な信頼性のレベルを確保するために、鍵となる宇宙交通管理(stm)プロセスに高いレベルの自動化を導入することが重要である。
これらのプロセスは衝突リスクの検出から、取るべき適切な行動の特定、回避操作の実行まで様々である。
本研究では,RL(Reinforcement Learning)技術に基づく自律的なCA意思決定機能の実装を提案する。
部分観測可能なマルコフ決定過程(pomdp)の枠組みに基づく新しい方法論を開発し、認識論的および随伴的不確実性を考慮して、宇宙船上で人工知能(ai)システムを訓練する。
提案フレームワークは、軌道上の破片の状態を不完全な監視情報として考慮し、AIシステムが正確な衝突回避策(CAM)を実行するための確率的方針を効果的に学習できるようにする。
目的は、CAMを自律的に実施するための意思決定プロセスを、人間の介入なしに宇宙船に委譲することである。
このアプローチは、意思決定プロセスと高度に分散したオペレーションにおいて、より迅速な応答を可能にする。
関連論文リスト
- On-orbit Servicing for Spacecraft Collision Avoidance With Autonomous Decision Making [0.0]
本研究は、宇宙船衝突回避演習(CAM)を支援するために、AIによるOOSミッションの実装を開発する。
本稿では、RL(Reinforcement Learning)を用いて訓練された自律型サーベイラを提案し、ターゲット衛星と宇宙デブリの衝突を自律的に検出し、絶滅危惧衛星とのランデブーとドッキングを行い、最適なCAMを実行する。
論文 参考訳(メタデータ) (2024-09-25T17:40:37Z) - AI-Driven Risk-Aware Scheduling for Active Debris Removal Missions [0.0]
低地球軌道でのデブリは、宇宙の持続可能性と宇宙船の安全性に対する重大な脅威である。
装甲輸送車両(OTV)は破片の軌道離脱を促進し、将来の衝突リスクを減らす。
深部補強学習(DRL)に基づく装甲決定計画モデルを構築し,OTVを最適デブリ除去シークエンシングを計画する。
提案手法を用いることで、最適なミッションプランを見つけ、衝突リスクの高い破片のリスクハンドリングを含む自律的に計画の更新を学べることが示されている。
論文 参考訳(メタデータ) (2024-09-25T15:16:07Z) - Aquatic Navigation: A Challenging Benchmark for Deep Reinforcement Learning [53.3760591018817]
ゲームエンジンとDeep Reinforcement Learningの統合の最近の進歩を利用して,水上ナビゲーションのための新しいベンチマーク環境を提案する。
具体的には、最も広く受け入れられているアルゴリズムの一つであるPPOに着目し、先進的なトレーニング手法を提案する。
実験により,これらの成分をうまく組み合わせることで,有望な結果が得られることが示された。
論文 参考訳(メタデータ) (2024-05-30T23:20:23Z) - RACER: Epistemic Risk-Sensitive RL Enables Fast Driving with Fewer Crashes [57.319845580050924]
本稿では,リスク感応制御と適応行動空間のカリキュラムを組み合わせた強化学習フレームワークを提案する。
提案アルゴリズムは,現実世界のオフロード運転タスクに対して,高速なポリシーを学習可能であることを示す。
論文 参考訳(メタデータ) (2024-05-07T23:32:36Z) - Convergence of Communications, Control, and Machine Learning for Secure
and Autonomous Vehicle Navigation [78.60496411542549]
接続された自動運転車(CAV)は、交通事故におけるヒューマンエラーを低減し、道路効率を向上し、様々なタスクを実行する。これらのメリットを享受するためには、CAVが目標とする目的地へ自律的にナビゲートする必要がある。
本稿では,通信理論,制御理論,機械学習の収束を利用して,効果的なCAVナビゲーションを実現する手法を提案する。
論文 参考訳(メタデータ) (2023-07-05T21:38:36Z) - HALO: Hazard-Aware Landing Optimization for Autonomous Systems [1.5414037351414311]
本稿では,ハザード検出,最適着陸軌道生成,緊急計画課題に対処する認識計画手法を提案する。
本研究では,HALSS(Hazard-Aware Landing Site Selection)とAdaptive Deferred-Decision Trajectory Optimization(Adaptive Deferred-Decision Trajectory Optimization,-DDTO)という2つの新しいアルゴリズムを開発し,統合し,認識と計画の課題に対処する。
シミュレーションした火星環境を用いたアプローチの有効性を実証し, 組み合わせた認識計画法が着地成功率を高めることを示す。
論文 参考訳(メタデータ) (2023-04-04T07:20:06Z) - Reinforcement Learning-Based Air Traffic Deconfliction [7.782300855058585]
本研究は,2機の水平分離を自動化することに焦点を当て,障害物回避問題を2次元サロゲート最適化課題として提示する。
強化学習(RL)を用いて、回避ポリシーを最適化し、ダイナミクス、インタラクション、意思決定をモデル化する。
提案システムは,安全要件を満たす高速かつ達成可能な回避軌道を生成する。
論文 参考訳(メタデータ) (2023-01-05T00:37:20Z) - Risk-based implementation of COLREGs for autonomous surface vehicles
using deep reinforcement learning [1.304892050913381]
深層強化学習(DRL)は幅広い応用の可能性を示している。
本研究は,海上衝突防止国際規則(COLREG)のサブセットをDRLに基づく経路追従と障害物回避システムに組み込んだものである。
得られた自律エージェントは、訓練シナリオ、孤立した遭遇状況、実世界のシナリオのAISに基づくシミュレーションにおいて、経路追従とCOLREG準拠の衝突回避を動的に補間する。
論文 参考訳(メタデータ) (2021-11-30T21:32:59Z) - OSCAR: Data-Driven Operational Space Control for Adaptive and Robust
Robot Manipulation [50.59541802645156]
オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。
本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。
本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-10-02T01:21:38Z) - SABER: Data-Driven Motion Planner for Autonomously Navigating
Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。
モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。
リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。
ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文 参考訳(メタデータ) (2021-08-03T02:56:21Z) - Reinforcement Learning for Low-Thrust Trajectory Design of
Interplanetary Missions [77.34726150561087]
本稿では, 惑星間軌道のロバスト設計における強化学習の適用について検討する。
最先端アルゴリズムのオープンソース実装が採用されている。
その結果得られた誘導制御ネットワークは、堅牢な名目的軌道と関連する閉ループ誘導法の両方を提供する。
論文 参考訳(メタデータ) (2020-08-19T15:22:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。