Fugu-MT 論文翻訳(概要): A Deep Multi-Agent Reinforcement Learning Approach to Autonomous Separation Assurance

論文の概要: A Deep Multi-Agent Reinforcement Learning Approach to Autonomous Separation Assurance

arxiv url: http://arxiv.org/abs/2003.08353v2
Date: Thu, 27 Aug 2020 16:46:52 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-22 20:19:10.386212
Title: A Deep Multi-Agent Reinforcement Learning Approach to Autonomous Separation Assurance
Title（参考訳）: 自律的分離保証のための深層マルチエージェント強化学習手法
Authors: Marc Brittain, Xuxi Yang, Peng Wei
Abstract要約: 可変数の航空機間の衝突を識別・解決するために, 深層多エージェント強化学習フレームワークを提案する。提案手法は,BlueSkyの航空交通制御環境における3つのケーススタディで検証された。
参考スコア（独自算出の注目度）: 5.196149362684628
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: A novel deep multi-agent reinforcement learning framework is proposed to identify and resolve conflicts among a variable number of aircraft in a high-density, stochastic, and dynamic sector. Currently the sector capacity is constrained by human air traffic controller's cognitive limitation. We investigate the feasibility of a new concept (autonomous separation assurance) and a new approach to push the sector capacity above human cognitive limitation. We propose the concept of using distributed vehicle autonomy to ensure separation, instead of a centralized sector air traffic controller. Our proposed framework utilizes Proximal Policy Optimization (PPO) that we modify to incorporate an attention network. This allows the agents to have access to variable aircraft information in the sector in a scalable, efficient approach to achieve high traffic throughput under uncertainty. Agents are trained using a centralized learning, decentralized execution scheme where one neural network is learned and shared by all agents. The proposed framework is validated on three challenging case studies in the BlueSky air traffic control environment. Numerical results show the proposed framework significantly reduces offline training time, increases performance, and results in a more efficient policy.
Abstract（参考訳）: 高密度, 確率, 動的セクターにおいて, 航空機間の衝突を同定し, 解決するために, 深層多エージェント強化学習フレームワークを提案する。現在、セクター容量は人間の航空管制官の認知的制限によって制限されている。本稿では,新しい概念(自律的分離保証)の実現可能性と,人間の認知能力の限界を超える新しいアプローチについて検討する。本稿では,集中型航空交通制御装置ではなく,分散車両の自律性を利用して分離を確実にする概念を提案する。提案するフレームワークは,注目ネットワークを組み込むために修正したPPO(Proximal Policy Optimization)を利用する。これによりエージェントは、不確実性下で高いトラフィックスループットを達成するためにスケーラブルで効率的なアプローチで、セクター内の可変航空機情報にアクセスすることができる。エージェントは集中型学習と分散実行を使用してトレーニングされ、ひとつのニューラルネットワークが学習され、すべてのエージェントによって共有される。提案手法は,BlueSkyの航空交通制御環境における3つのケーススタディで検証された。計算結果から,提案フレームワークはオフライントレーニング時間を大幅に短縮し,性能を向上し,より効率的なポリシを実現する。

関連論文リスト

Goal-Oriented Multi-Agent Reinforcement Learning for Decentralized Agent Teams [0.6676697660506798]
本稿では,車両がエージェントとして機能し,局地的な目標や観測に基づいて選択的にコミュニケーションできる分散マルチエージェント強化学習(MARL)フレームワークを提案する。この目標対応コミュニケーション戦略により、エージェントは関連する情報のみを共有することができ、可視性制限を尊重しながらコラボレーションを強化することができる。その結果,本手法は作業成功率を大幅に改善し,非協調的ベースラインに比べて時間とゴールを短縮することがわかった。
論文参考訳（メタデータ） (2025-11-15T02:11:31Z)
Discrete Diffusion for Reflective Vision-Language-Action Models in Autonomous Driving [55.13109926181247]
離散拡散による安全な軌道生成のためのリフレクション機構を統合した学習ベースのフレームワークであるReflectDriveを紹介する。我々のアプローチの中心は、勾配のない反復的な自己補正を行う、安全を意識した反射機構である。本手法は目標条件付き軌道生成から始まり,マルチモーダル運転動作をモデル化する。
論文参考訳（メタデータ） (2025-09-24T13:35:15Z)
Cluster-Based Multi-Agent Task Scheduling for Space-Air-Ground Integrated Networks [60.085771314013044]
低高度経済は、コミュニケーションやセンシングなどの分野で発展する大きな可能性を秘めている。本稿では,SAGINにおけるマルチUAV協調タスクスケジューリング問題に対処するため,クラスタリングに基づく多エージェントDeep Deterministic Policy Gradient (CMADDPG)アルゴリズムを提案する。
論文参考訳（メタデータ） (2024-12-14T06:17:33Z)
Hierarchical Multi-Agent DRL Based Dynamic Cluster Reconfiguration for UAV Mobility Management [46.80160709931929]
マルチコネクション性には、分散アクセスポイント(AP)間の動的クラスタ形成と、これらのAPからのリソース割り当ての調整が含まれる。本研究では,エネルギー効率のよい動的クラスタ再構成を用いた無人航空機(UAV)の移動性管理手法を提案する。
論文参考訳（メタデータ） (2024-12-05T19:20:42Z)
Agent-Agnostic Centralized Training for Decentralized Multi-Agent Cooperative Driving [17.659812774579756]
本研究では,自律走行車における分散型協調運転ポリシーを学習する非対称アクター・批判モデルを提案する。マスキングを用いたアテンションニューラルネットワークを用いることで,実世界の交通動態と部分観測可能性の効率よく管理できる。
論文参考訳（メタデータ） (2024-03-18T16:13:02Z)
Improving Autonomous Separation Assurance through Distributed Reinforcement Learning with Attention Networks [0.0]
本稿では,AAM廊下内で自律的な自己分離機能を実現するための強化学習フレームワークを提案する。この問題はマルコフ決定プロセス(Markov Decision Process)として定式化され、サンプル効率の良いオフポリティ・ソフトアクター・クリティック(SAC)アルゴリズムへの新たな拡張を開発することで解決される。包括的数値計算により,提案手法は高密度・動的環境下で航空機の安全かつ効率的な分離を保証できることが示唆された。
論文参考訳（メタデータ） (2023-08-09T13:44:35Z)
Safe Model-Based Multi-Agent Mean-Field Reinforcement Learning [48.667697255912614]
平均場強化学習は、同一エージェントの無限集団と相互作用する代表エージェントのポリシーに対処する。モデルベースの平均場強化学習アルゴリズムであるSafe-M$3$-UCRLを提案する。本アルゴリズムは,低需要領域におけるサービスアクセシビリティを確保しつつ,重要な領域における需要を効果的に満たす。
論文参考訳（メタデータ） (2023-06-29T15:57:07Z)
Safe Multi-agent Learning via Trapping Regions [89.24858306636816]
我々は、動的システムの定性理論から知られているトラップ領域の概念を適用し、分散学習のための共同戦略空間に安全セットを作成する。本稿では,既知の学習力学を持つシステムにおいて,候補がトラップ領域を形成することを検証するための二分分割アルゴリズムと,学習力学が未知のシナリオに対するサンプリングアルゴリズムを提案する。
論文参考訳（メタデータ） (2023-02-27T14:47:52Z)
Hierarchical Reinforcement Learning with Opponent Modeling for Distributed Multi-agent Cooperation [13.670618752160594]
深層強化学習(DRL)はエージェントと環境の相互作用を通じて多エージェント協調に有望なアプローチを提供する。従来のDRLソリューションは、ポリシー探索中に連続的なアクション空間を持つ複数のエージェントの高次元に悩まされる。効率的な政策探索のための高レベル意思決定と低レベル個別制御を用いた階層型強化学習手法を提案する。
論文参考訳（メタデータ） (2022-06-25T19:09:29Z)
Optimization for Master-UAV-powered Auxiliary-Aerial-IRS-assisted IoT Networks: An Option-based Multi-agent Hierarchical Deep Reinforcement Learning Approach [56.84948632954274]
本稿では,無人航空機(MUAV)搭載のIoT(Internet of Things)ネットワークについて検討する。本稿では、インテリジェント反射面(IRS)を備えた充電可能な補助UAV(AUAV)を用いて、MUAVからの通信信号を強化することを提案する。提案モデルでは,IoTネットワークの蓄積スループットを最大化するために,これらのエネルギー制限されたUAVの最適協調戦略について検討する。
論文参考訳（メタデータ） (2021-12-20T15:45:28Z)
Relative Distributed Formation and Obstacle Avoidance with Multi-agent Reinforcement Learning [20.401609420707867]
マルチエージェント強化学習(MARL)に基づく分散生成・障害物回避手法を提案する。提案手法は, 障害物回避における生成誤差, 生成収束率, オンパー成功率に関して, ベースラインと比較して高い性能を実現する。
論文参考訳（メタデータ） (2021-11-14T13:02:45Z)
Transferable Deep Reinforcement Learning Framework for Autonomous Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文参考訳（メタデータ） (2021-05-28T08:45:37Z)
Optimizing Mixed Autonomy Traffic Flow With Decentralized Autonomous Vehicles and Multi-Agent RL [63.52264764099532]
本研究では、完全分散制御方式を用いて、混合自律環境でのボトルネックのスループットを向上させる自動運転車の能力について検討する。この問題にマルチエージェント強化アルゴリズムを適用し、5%の浸透速度で20%から40%の浸透速度で33%までのボトルネックスループットの大幅な改善が達成できることを実証した。
論文参考訳（メタデータ） (2020-10-30T22:06:05Z)
F2A2: Flexible Fully-decentralized Approximate Actor-critic for Cooperative Multi-agent Reinforcement Learning [110.35516334788687]
分散マルチエージェント強化学習アルゴリズムは複雑なアプリケーションでは実践的でないことがある。本稿では,大規模で汎用的なマルチエージェント設定を扱える,柔軟な完全分散型アクター批判型MARLフレームワークを提案する。当社のフレームワークは,大規模環境におけるスケーラビリティと安定性を実現し,情報伝達を低減できる。
論文参考訳（メタデータ） (2020-04-17T14:56:29Z)
A Deep Ensemble Multi-Agent Reinforcement Learning Approach for Air Traffic Control [5.550794444001022]
本稿では,マルチエージェント強化学習(MARL)を活用し,航空機の速度調整をリアルタイムで提案する知的意思決定フレームワークを提案する。本システムの目的は,航空交通渋滞の回避,ニアミス状況の改善,到着スケジュールの改善のため,航空交通管制官が航空機に効果的な誘導を行う能力を高めることである。
論文参考訳（メタデータ） (2020-04-03T06:03:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。