論文の概要: A Deep Multi-Agent Reinforcement Learning Approach to Autonomous
Separation Assurance
- arxiv url: http://arxiv.org/abs/2003.08353v2
- Date: Thu, 27 Aug 2020 16:46:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-22 20:19:10.386212
- Title: A Deep Multi-Agent Reinforcement Learning Approach to Autonomous
Separation Assurance
- Title(参考訳): 自律的分離保証のための深層マルチエージェント強化学習手法
- Authors: Marc Brittain, Xuxi Yang, Peng Wei
- Abstract要約: 可変数の航空機間の衝突を識別・解決するために, 深層多エージェント強化学習フレームワークを提案する。
提案手法は,BlueSkyの航空交通制御環境における3つのケーススタディで検証された。
- 参考スコア(独自算出の注目度): 5.196149362684628
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A novel deep multi-agent reinforcement learning framework is proposed to
identify and resolve conflicts among a variable number of aircraft in a
high-density, stochastic, and dynamic sector. Currently the sector capacity is
constrained by human air traffic controller's cognitive limitation. We
investigate the feasibility of a new concept (autonomous separation assurance)
and a new approach to push the sector capacity above human cognitive
limitation. We propose the concept of using distributed vehicle autonomy to
ensure separation, instead of a centralized sector air traffic controller. Our
proposed framework utilizes Proximal Policy Optimization (PPO) that we modify
to incorporate an attention network. This allows the agents to have access to
variable aircraft information in the sector in a scalable, efficient approach
to achieve high traffic throughput under uncertainty. Agents are trained using
a centralized learning, decentralized execution scheme where one neural network
is learned and shared by all agents. The proposed framework is validated on
three challenging case studies in the BlueSky air traffic control environment.
Numerical results show the proposed framework significantly reduces offline
training time, increases performance, and results in a more efficient policy.
- Abstract(参考訳): 高密度, 確率, 動的セクターにおいて, 航空機間の衝突を同定し, 解決するために, 深層多エージェント強化学習フレームワークを提案する。
現在、セクター容量は人間の航空管制官の認知的制限によって制限されている。
本稿では,新しい概念(自律的分離保証)の実現可能性と,人間の認知能力の限界を超える新しいアプローチについて検討する。
本稿では,集中型航空交通制御装置ではなく,分散車両の自律性を利用して分離を確実にする概念を提案する。
提案するフレームワークは,注目ネットワークを組み込むために修正したPPO(Proximal Policy Optimization)を利用する。
これによりエージェントは、不確実性下で高いトラフィックスループットを達成するためにスケーラブルで効率的なアプローチで、セクター内の可変航空機情報にアクセスすることができる。
エージェントは集中型学習と分散実行を使用してトレーニングされ、ひとつのニューラルネットワークが学習され、すべてのエージェントによって共有される。
提案手法は,BlueSkyの航空交通制御環境における3つのケーススタディで検証された。
計算結果から,提案フレームワークはオフライントレーニング時間を大幅に短縮し,性能を向上し,より効率的なポリシを実現する。
関連論文リスト
- Agent-Agnostic Centralized Training for Decentralized Multi-Agent Cooperative Driving [17.659812774579756]
本研究では,自律走行車における分散型協調運転ポリシーを学習する非対称アクター・批判モデルを提案する。
マスキングを用いたアテンションニューラルネットワークを用いることで,実世界の交通動態と部分観測可能性の効率よく管理できる。
論文 参考訳(メタデータ) (2024-03-18T16:13:02Z) - Improving Autonomous Separation Assurance through Distributed
Reinforcement Learning with Attention Networks [0.0]
本稿では,AAM廊下内で自律的な自己分離機能を実現するための強化学習フレームワークを提案する。
この問題はマルコフ決定プロセス(Markov Decision Process)として定式化され、サンプル効率の良いオフポリティ・ソフトアクター・クリティック(SAC)アルゴリズムへの新たな拡張を開発することで解決される。
包括的数値計算により,提案手法は高密度・動的環境下で航空機の安全かつ効率的な分離を保証できることが示唆された。
論文 参考訳(メタデータ) (2023-08-09T13:44:35Z) - Safe Model-Based Multi-Agent Mean-Field Reinforcement Learning [48.667697255912614]
平均場強化学習は、同一エージェントの無限集団と相互作用する代表エージェントのポリシーに対処する。
モデルベースの平均場強化学習アルゴリズムであるSafe-M$3$-UCRLを提案する。
本アルゴリズムは,低需要領域におけるサービスアクセシビリティを確保しつつ,重要な領域における需要を効果的に満たす。
論文 参考訳(メタデータ) (2023-06-29T15:57:07Z) - Safe Multi-agent Learning via Trapping Regions [89.24858306636816]
我々は、動的システムの定性理論から知られているトラップ領域の概念を適用し、分散学習のための共同戦略空間に安全セットを作成する。
本稿では,既知の学習力学を持つシステムにおいて,候補がトラップ領域を形成することを検証するための二分分割アルゴリズムと,学習力学が未知のシナリオに対するサンプリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-27T14:47:52Z) - Hierarchical Reinforcement Learning with Opponent Modeling for
Distributed Multi-agent Cooperation [13.670618752160594]
深層強化学習(DRL)はエージェントと環境の相互作用を通じて多エージェント協調に有望なアプローチを提供する。
従来のDRLソリューションは、ポリシー探索中に連続的なアクション空間を持つ複数のエージェントの高次元に悩まされる。
効率的な政策探索のための高レベル意思決定と低レベル個別制御を用いた階層型強化学習手法を提案する。
論文 参考訳(メタデータ) (2022-06-25T19:09:29Z) - Optimization for Master-UAV-powered Auxiliary-Aerial-IRS-assisted IoT
Networks: An Option-based Multi-agent Hierarchical Deep Reinforcement
Learning Approach [56.84948632954274]
本稿では,無人航空機(MUAV)搭載のIoT(Internet of Things)ネットワークについて検討する。
本稿では、インテリジェント反射面(IRS)を備えた充電可能な補助UAV(AUAV)を用いて、MUAVからの通信信号を強化することを提案する。
提案モデルでは,IoTネットワークの蓄積スループットを最大化するために,これらのエネルギー制限されたUAVの最適協調戦略について検討する。
論文 参考訳(メタデータ) (2021-12-20T15:45:28Z) - Relative Distributed Formation and Obstacle Avoidance with Multi-agent
Reinforcement Learning [20.401609420707867]
マルチエージェント強化学習(MARL)に基づく分散生成・障害物回避手法を提案する。
提案手法は, 障害物回避における生成誤差, 生成収束率, オンパー成功率に関して, ベースラインと比較して高い性能を実現する。
論文 参考訳(メタデータ) (2021-11-14T13:02:45Z) - Transferable Deep Reinforcement Learning Framework for Autonomous
Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。
そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。
提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文 参考訳(メタデータ) (2021-05-28T08:45:37Z) - Optimizing Mixed Autonomy Traffic Flow With Decentralized Autonomous
Vehicles and Multi-Agent RL [63.52264764099532]
本研究では、完全分散制御方式を用いて、混合自律環境でのボトルネックのスループットを向上させる自動運転車の能力について検討する。
この問題にマルチエージェント強化アルゴリズムを適用し、5%の浸透速度で20%から40%の浸透速度で33%までのボトルネックスループットの大幅な改善が達成できることを実証した。
論文 参考訳(メタデータ) (2020-10-30T22:06:05Z) - F2A2: Flexible Fully-decentralized Approximate Actor-critic for
Cooperative Multi-agent Reinforcement Learning [110.35516334788687]
分散マルチエージェント強化学習アルゴリズムは複雑なアプリケーションでは実践的でないことがある。
本稿では,大規模で汎用的なマルチエージェント設定を扱える,柔軟な完全分散型アクター批判型MARLフレームワークを提案する。
当社のフレームワークは,大規模環境におけるスケーラビリティと安定性を実現し,情報伝達を低減できる。
論文 参考訳(メタデータ) (2020-04-17T14:56:29Z) - A Deep Ensemble Multi-Agent Reinforcement Learning Approach for Air
Traffic Control [5.550794444001022]
本稿では,マルチエージェント強化学習(MARL)を活用し,航空機の速度調整をリアルタイムで提案する知的意思決定フレームワークを提案する。
本システムの目的は,航空交通渋滞の回避,ニアミス状況の改善,到着スケジュールの改善のため,航空交通管制官が航空機に効果的な誘導を行う能力を高めることである。
論文 参考訳(メタデータ) (2020-04-03T06:03:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。