論文の概要: Exposure-Based Multi-Agent Inspection of a Tumbling Target Using Deep
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2302.14188v1
- Date: Mon, 27 Feb 2023 22:54:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-01 18:41:01.545324
- Title: Exposure-Based Multi-Agent Inspection of a Tumbling Target Using Deep
Reinforcement Learning
- Title(参考訳): 深層強化学習を用いたタンブリングターゲットの被曝型マルチエージェント検査
- Authors: Joshua Aurand, Steven Cutlip, Henry Lei, Kendra Lang, and Sean
Phillips
- Abstract要約: 転倒対象のマルチエージェント検査を分散的に計画するための階層的,学習的なアプローチを考察する。
我々のソリューションは2つのコンポーネントから構成される: 深い強化学習を用いて訓練された視点または高レベルプランナーと、ポイントツーポイントナビゲーションを扱うナビゲーションプランナーである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: As space becomes more congested, on orbit inspection is an increasingly
relevant activity whether to observe a defunct satellite for planning repairs
or to de-orbit it. However, the task of on orbit inspection itself is
challenging, typically requiring the careful coordination of multiple observer
satellites. This is complicated by a highly nonlinear environment where the
target may be unknown or moving unpredictably without time for continuous
command and control from the ground. There is a need for autonomous, robust,
decentralized solutions to the inspection task. To achieve this, we consider a
hierarchical, learned approach for the decentralized planning of multi-agent
inspection of a tumbling target. Our solution consists of two components: a
viewpoint or high-level planner trained using deep reinforcement learning and a
navigation planner handling point-to-point navigation between pre-specified
viewpoints. We present a novel problem formulation and methodology that is
suitable not only to reinforcement learning-derived robust policies, but
extendable to unknown target geometries and higher fidelity information
theoretic objectives received directly from sensor inputs. Operating under
limited information, our trained multi-agent high-level policies successfully
contextualize information within the global hierarchical environment and are
correspondingly able to inspect over 90% of non-convex tumbling targets, even
in the absence of additional agent attitude control.
- Abstract(参考訳): 宇宙がより混雑するにつれて、軌道検査は、修理の計画のために廃衛星を観測するか、軌道を外すかに関係する活動である。
しかし、軌道上の検査自体の作業は困難であり、通常は複数の観測衛星の注意深く調整する必要がある。
これは高度に非線形な環境で複雑であり、目標が未知であるか、あるいは地上からの連続的な指令と制御の時間無しに予測不能に動く可能性がある。
検査タスクには、自律的で堅牢で分散化されたソリューションが必要です。
これを実現するために,マルチエージェント検査の分散計画における階層的,学習的なアプローチを検討する。
このソリューションは,深層強化学習を用いて訓練された視点と高レベルプランナーと,事前指定された視点間のポイント・ツー・ポイントのナビゲーションを扱うナビゲーションプランナーの2つの構成要素からなる。
本稿では,学習に基づく堅牢な政策の強化だけでなく,未知のターゲットジオメトリに拡張可能な新たな問題定式化手法と,センサ入力から直接受ける高忠実度情報理論の目的について述べる。
限られた情報に基づいて、訓練されたマルチエージェントハイレベルポリシーは、グローバル階層環境内で情報のコンテキスト化に成功し、追加のエージェント姿勢制御がなくても、90%以上の非凸タンブリングターゲットを検査することが可能です。
関連論文リスト
- Learn to Follow: Decentralized Lifelong Multi-agent Pathfinding via
Planning and Learning [46.354187895184154]
マルチエージェントパスフィンディング(MAPF)問題は通常、グラフに制限されたエージェントの集合に対する競合のないパスの集合を見つけるよう要求する。
本研究では,エージェントの位置や目標に関する情報をすべて収集する中央制御器が存在しない場合の分散MAPF設定について検討する。
我々は,先行するエージェントに新たな目標を連続的に割り当てることを含むMAPFの実用上重要な寿命変化に焦点をあてる。
論文 参考訳(メタデータ) (2023-10-02T13:51:32Z) - Enhancing Infrared Small Target Detection Robustness with Bi-Level
Adversarial Framework [61.34862133870934]
本稿では,異なる汚職の存在下での検出の堅牢性を促進するために,二段階の対向的枠組みを提案する。
我々の手法は広範囲の汚職で21.96%のIOUを著しく改善し、特に一般ベンチマークで4.97%のIOUを推進している。
論文 参考訳(メタデータ) (2023-09-03T06:35:07Z) - Distributed multi-agent target search and tracking with Gaussian process
and reinforcement learning [26.499110405106812]
分散プロセスに基づくターゲットマップ構築によるマルチエージェント強化学習手法を提案する。
シミュレーションにおける訓練された方針の性能と伝達性を評価し, 小型無人航空機の群集上での手法を実証した。
論文 参考訳(メタデータ) (2023-08-29T01:53:14Z) - Deep Hierarchical Planning from Pixels [86.14687388689204]
Directorは、学習された世界モデルの潜在空間内で計画し、ピクセルから直接階層的な振る舞いを学ぶ方法である。
潜在空間で運用されているにもかかわらず、世界モデルは視覚化のためにゴールを画像にデコードできるため、決定は解釈可能である。
Directorはまた、ビジュアルコントロール、Atariゲーム、DMLabレベルなど、幅広い環境で成功した行動を学ぶ。
論文 参考訳(メタデータ) (2022-06-08T18:20:15Z) - Learning to Track Dynamic Targets in Partially Known Environments [48.49957897251128]
我々は、アクティブな目標追跡を解決するために、深層強化学習アプローチを用いる。
特に,アクティブ・トラッカー・ターゲティング・ネットワーク(ATTN)を導入し,アクティブ・ターゲティング・ターゲティングの主要なタスクを解決するための統一的なRLポリシーを提案する。
論文 参考訳(メタデータ) (2020-06-17T22:45:24Z) - Planning to Explore via Self-Supervised World Models [120.31359262226758]
Plan2Exploreは自己監督型強化学習エージェントである。
我々は、自己監督型探索と、新しいタスクへの迅速な適応に対する新しいアプローチを提案する。
Plan2Exploreは、訓練の監督やタスク固有の相互作用がなければ、自己監督型の探査方法よりも優れている。
論文 参考訳(メタデータ) (2020-05-12T17:59:45Z) - Reinforcement Learning for UAV Autonomous Navigation, Mapping and Target
Detection [36.79380276028116]
本研究では,無人航空機(UAV)に低高度レーダーを装備し,未知の環境下での飛行における共同検出・マッピング・ナビゲーション問題について検討する。
目的は、マッピング精度を最大化する目的で軌道を最適化することであり、目標検出の観点からは、測定が不十分な領域を避けることである。
論文 参考訳(メタデータ) (2020-05-05T20:39:18Z) - Weakly-Supervised Reinforcement Learning for Controllable Behavior [126.04932929741538]
強化学習(Reinforcement Learning、RL)は、タスクを解決するために行動を取るための学習のための強力なフレームワークである。
多くの設定において、エージェントは、現在解決するよう求められている単一のタスクに対して、不可能なほど大きなタスク空間を放棄しなければならない。
我々は,この意味論的意味のあるタスクのサブスペースを,非意味的な「チャフ」タスクの巨大な空間から自動的に切り離すために,弱い監督を利用するフレームワークを導入する。
論文 参考訳(メタデータ) (2020-04-06T17:50:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。