論文の概要: A Deep Multi-Agent Reinforcement Learning Approach to Autonomous
Separation Assurance
- arxiv url: http://arxiv.org/abs/2003.08353v2
- Date: Thu, 27 Aug 2020 16:46:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-22 20:19:10.386212
- Title: A Deep Multi-Agent Reinforcement Learning Approach to Autonomous
Separation Assurance
- Title(参考訳): 自律的分離保証のための深層マルチエージェント強化学習手法
- Authors: Marc Brittain, Xuxi Yang, Peng Wei
- Abstract要約: 可変数の航空機間の衝突を識別・解決するために, 深層多エージェント強化学習フレームワークを提案する。
提案手法は,BlueSkyの航空交通制御環境における3つのケーススタディで検証された。
- 参考スコア(独自算出の注目度): 5.196149362684628
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A novel deep multi-agent reinforcement learning framework is proposed to
identify and resolve conflicts among a variable number of aircraft in a
high-density, stochastic, and dynamic sector. Currently the sector capacity is
constrained by human air traffic controller's cognitive limitation. We
investigate the feasibility of a new concept (autonomous separation assurance)
and a new approach to push the sector capacity above human cognitive
limitation. We propose the concept of using distributed vehicle autonomy to
ensure separation, instead of a centralized sector air traffic controller. Our
proposed framework utilizes Proximal Policy Optimization (PPO) that we modify
to incorporate an attention network. This allows the agents to have access to
variable aircraft information in the sector in a scalable, efficient approach
to achieve high traffic throughput under uncertainty. Agents are trained using
a centralized learning, decentralized execution scheme where one neural network
is learned and shared by all agents. The proposed framework is validated on
three challenging case studies in the BlueSky air traffic control environment.
Numerical results show the proposed framework significantly reduces offline
training time, increases performance, and results in a more efficient policy.
- Abstract(参考訳): 高密度, 確率, 動的セクターにおいて, 航空機間の衝突を同定し, 解決するために, 深層多エージェント強化学習フレームワークを提案する。
現在、セクター容量は人間の航空管制官の認知的制限によって制限されている。
本稿では,新しい概念(自律的分離保証)の実現可能性と,人間の認知能力の限界を超える新しいアプローチについて検討する。
本稿では,集中型航空交通制御装置ではなく,分散車両の自律性を利用して分離を確実にする概念を提案する。
提案するフレームワークは,注目ネットワークを組み込むために修正したPPO(Proximal Policy Optimization)を利用する。
これによりエージェントは、不確実性下で高いトラフィックスループットを達成するためにスケーラブルで効率的なアプローチで、セクター内の可変航空機情報にアクセスすることができる。
エージェントは集中型学習と分散実行を使用してトレーニングされ、ひとつのニューラルネットワークが学習され、すべてのエージェントによって共有される。
提案手法は,BlueSkyの航空交通制御環境における3つのケーススタディで検証された。
計算結果から,提案フレームワークはオフライントレーニング時間を大幅に短縮し,性能を向上し,より効率的なポリシを実現する。
関連論文リスト
- Cluster-Based Multi-Agent Task Scheduling for Space-Air-Ground Integrated Networks [60.085771314013044]
低高度経済は、コミュニケーションやセンシングなどの分野で発展する大きな可能性を秘めている。
本稿では,SAGINにおけるマルチUAV協調タスクスケジューリング問題に対処するため,クラスタリングに基づく多エージェントDeep Deterministic Policy Gradient (CMADDPG)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-12-14T06:17:33Z) - Hierarchical Multi-Agent DRL Based Dynamic Cluster Reconfiguration for UAV Mobility Management [46.80160709931929]
マルチコネクション性には、分散アクセスポイント(AP)間の動的クラスタ形成と、これらのAPからのリソース割り当ての調整が含まれる。
本研究では,エネルギー効率のよい動的クラスタ再構成を用いた無人航空機(UAV)の移動性管理手法を提案する。
論文 参考訳(メタデータ) (2024-12-05T19:20:42Z) - Agent-Agnostic Centralized Training for Decentralized Multi-Agent Cooperative Driving [17.659812774579756]
本研究では,自律走行車における分散型協調運転ポリシーを学習する非対称アクター・批判モデルを提案する。
マスキングを用いたアテンションニューラルネットワークを用いることで,実世界の交通動態と部分観測可能性の効率よく管理できる。
論文 参考訳(メタデータ) (2024-03-18T16:13:02Z) - Improving Autonomous Separation Assurance through Distributed
Reinforcement Learning with Attention Networks [0.0]
本稿では,AAM廊下内で自律的な自己分離機能を実現するための強化学習フレームワークを提案する。
この問題はマルコフ決定プロセス(Markov Decision Process)として定式化され、サンプル効率の良いオフポリティ・ソフトアクター・クリティック(SAC)アルゴリズムへの新たな拡張を開発することで解決される。
包括的数値計算により,提案手法は高密度・動的環境下で航空機の安全かつ効率的な分離を保証できることが示唆された。
論文 参考訳(メタデータ) (2023-08-09T13:44:35Z) - Safe Model-Based Multi-Agent Mean-Field Reinforcement Learning [48.667697255912614]
平均場強化学習は、同一エージェントの無限集団と相互作用する代表エージェントのポリシーに対処する。
モデルベースの平均場強化学習アルゴリズムであるSafe-M$3$-UCRLを提案する。
本アルゴリズムは,低需要領域におけるサービスアクセシビリティを確保しつつ,重要な領域における需要を効果的に満たす。
論文 参考訳(メタデータ) (2023-06-29T15:57:07Z) - Safe Multi-agent Learning via Trapping Regions [89.24858306636816]
我々は、動的システムの定性理論から知られているトラップ領域の概念を適用し、分散学習のための共同戦略空間に安全セットを作成する。
本稿では,既知の学習力学を持つシステムにおいて,候補がトラップ領域を形成することを検証するための二分分割アルゴリズムと,学習力学が未知のシナリオに対するサンプリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-27T14:47:52Z) - Hierarchical Reinforcement Learning with Opponent Modeling for
Distributed Multi-agent Cooperation [13.670618752160594]
深層強化学習(DRL)はエージェントと環境の相互作用を通じて多エージェント協調に有望なアプローチを提供する。
従来のDRLソリューションは、ポリシー探索中に連続的なアクション空間を持つ複数のエージェントの高次元に悩まされる。
効率的な政策探索のための高レベル意思決定と低レベル個別制御を用いた階層型強化学習手法を提案する。
論文 参考訳(メタデータ) (2022-06-25T19:09:29Z) - Transferable Deep Reinforcement Learning Framework for Autonomous
Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。
そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。
提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文 参考訳(メタデータ) (2021-05-28T08:45:37Z) - F2A2: Flexible Fully-decentralized Approximate Actor-critic for
Cooperative Multi-agent Reinforcement Learning [110.35516334788687]
分散マルチエージェント強化学習アルゴリズムは複雑なアプリケーションでは実践的でないことがある。
本稿では,大規模で汎用的なマルチエージェント設定を扱える,柔軟な完全分散型アクター批判型MARLフレームワークを提案する。
当社のフレームワークは,大規模環境におけるスケーラビリティと安定性を実現し,情報伝達を低減できる。
論文 参考訳(メタデータ) (2020-04-17T14:56:29Z) - A Deep Ensemble Multi-Agent Reinforcement Learning Approach for Air
Traffic Control [5.550794444001022]
本稿では,マルチエージェント強化学習(MARL)を活用し,航空機の速度調整をリアルタイムで提案する知的意思決定フレームワークを提案する。
本システムの目的は,航空交通渋滞の回避,ニアミス状況の改善,到着スケジュールの改善のため,航空交通管制官が航空機に効果的な誘導を行う能力を高めることである。
論文 参考訳(メタデータ) (2020-04-03T06:03:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。