論文の概要: Transformer-based Multi-agent Reinforcement Learning for Separation Assurance in Structured and Unstructured Airspaces
- arxiv url: http://arxiv.org/abs/2601.04401v1
- Date: Wed, 07 Jan 2026 21:18:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 17:01:52.928077
- Title: Transformer-based Multi-agent Reinforcement Learning for Separation Assurance in Structured and Unstructured Airspaces
- Title(参考訳): 構造化空域と非構造空域の分離保証のためのトランスフォーマーに基づくマルチエージェント強化学習
- Authors: Arsyi Aziz, Peng Wei,
- Abstract要約: 本研究では, 単一エンコーダ構成により, 空中衝突速度付近でほぼゼロに近づき, 分離損失がより少ないことを示す。
提案したトレーニング戦略は, 航空機分離保証のための適応的かつスケーラブルな分散ソリューションを提供する。
- 参考スコア(独自算出の注目度): 3.719121868494767
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Conventional optimization-based metering depends on strict adherence to precomputed schedules, which limits the flexibility required for the stochastic operations of Advanced Air Mobility (AAM). In contrast, multi-agent reinforcement learning (MARL) offers a decentralized, adaptive framework that can better handle uncertainty, required for safe aircraft separation assurance. Despite this advantage, current MARL approaches often overfit to specific airspace structures, limiting their adaptability to new configurations. To improve generalization, we recast the MARL problem in a relative polar state space and train a transformer encoder model across diverse traffic patterns and intersection angles. The learned model provides speed advisories to resolve conflicts while maintaining aircraft near their desired cruising speeds. In our experiments, we evaluated encoder depths of 1, 2, and 3 layers in both structured and unstructured airspaces, and found that a single encoder configuration outperformed deeper variants, yielding near-zero near mid-air collision rates and shorter loss-of-separation infringements than the deeper configurations. Additionally, we showed that the same configuration outperforms a baseline model designed purely with attention. Together, our results suggest that the newly formulated state representation, novel design of neural network architecture, and proposed training strategy provide an adaptable and scalable decentralized solution for aircraft separation assurance in both structured and unstructured airspaces.
- Abstract(参考訳): 従来の最適化に基づく計測は、事前計算されたスケジュールへの厳密な遵守に依存しており、AAM(Advanced Air Mobility)の確率的操作に必要な柔軟性を制限している。
対照的に、マルチエージェント強化学習(MARL)は、航空機の安全な分離保証に必要な不確実性をよりよく扱える分散適応型フレームワークを提供する。
この利点にもかかわらず、現在のMARLのアプローチは、しばしば特定の空域構造に過度に適合し、新しい構成への適応性を制限している。
一般化を改善するために、相対極状態空間におけるMARL問題をリキャストし、様々な交通パターンと交差角をまたいだトランスフォーマーエンコーダモデルを訓練する。
学習したモデルは、所望の巡航速度近くで航空機を維持しながら、紛争を解決するためのスピードアドバイザリを提供する。
実験では, エンコーダの深さ1, 2, 3層の評価を行い, 単一エンコーダ構成では, 空中衝突速度がほぼゼロに近づき, セパレーションの損失がより少ないほど, より深い変動が認められた。
さらに、同じ構成が、純粋に注意を払って設計されたベースラインモデルよりも優れていることを示した。
この結果から,新たに構成された状態表現,ニューラルネットワークアーキテクチャの新規設計,および提案したトレーニング戦略が,航空機の分離保証に適応可能かつスケーラブルな分散化ソリューションを提供することが示唆された。
関連論文リスト
- MFC-RFNet: A Multi-scale Guided Rectified Flow Network for Radar Sequence Prediction [7.015114232190396]
レーダエコーシークエンスからの正確な高分解能降水は、災害軽減と経済計画に不可欠である。
鍵となる課題は、複雑なマルチスケール進化のモデル化、変位に起因するフレーム間特徴の不整合、長距離コンテキストの効率的なキャプチャである。
本稿では,MFRF-Net(Multiscale Feature Communication Rectified Flow Network)を提案する。
論文 参考訳(メタデータ) (2026-01-07T06:24:26Z) - CoCo-Fed: A Unified Framework for Memory- and Communication-Efficient Federated Learning at the Wireless Edge [50.42067935605982]
ローカルメモリの効率とグローバル通信の削減を両立させる新しい圧縮・結合型学習フレームワークを提案する。
CoCo-Fedは、メモリと通信効率の両方において最先端のベースラインを著しく上回り、非IID設定下では堅牢な収束を維持している。
論文 参考訳(メタデータ) (2026-01-02T03:39:50Z) - QoS-Aware Hierarchical Reinforcement Learning for Joint Link Selection and Trajectory Optimization in SAGIN-Supported UAV Mobility Management [52.15690855486153]
宇宙空間統合ネットワーク (SAGIN) がユビキタスUAV接続を実現するための重要なアーキテクチャとして登場した。
本稿では,SAGINにおけるUAVモビリティ管理を制約付き多目的関節最適化問題として定式化する。
論文 参考訳(メタデータ) (2025-12-17T06:22:46Z) - Multi-Phase Spacecraft Trajectory Optimization via Transformer-Based Reinforcement Learning [2.034091340570242]
本研究では,単一ポリシアーキテクチャを通じて多相軌道最適化を統一するトランスフォーマーベースのRLフレームワークを提案する。
その結果, トランスフォーマーをベースとしたフレームワークは, 単純な場合だけでなく, 動的に異なる状況下で協調的な制御ポリシーを効果的に学習することを示した。
論文 参考訳(メタデータ) (2025-11-14T15:29:46Z) - SA-EMO: Structure-Aligned Encoder Mixture of Operators for Generalizable Full-waveform Inversion [0.0]
フルウェーブフォーム・インバージョンは高分解能モデルを生成することができるが、本質的に不適切であり、非常に非線形であり、計算集約的である。
本研究では,未知の地下構造下での速度場反転のためのSA-EMOアーキテクチャを提案する。
SA-EMOは従来のCNNやシングルオペレーター法よりも大幅に優れており、平均で58.443%、境界分解能が10.308%向上している。
論文 参考訳(メタデータ) (2025-11-07T14:03:43Z) - Byzantine-Resilient Over-the-Air Federated Learning under Zero-Trust Architecture [68.83934802584899]
我々は,セキュアな適応クラスタリング(FedSAC)を用いたフェデレーション学習(Federated Learning)と呼ばれる,無線通信のための新しいビザンチン・ロバストFLパラダイムを提案する。
FedSACは、デバイスの一部をゼロ信頼アーキテクチャ(ZTA)ベースのビザンティン識別と適応デバイスクラスタリングによる攻撃から保護することを目的としている。
実験精度と収束率の両面から,提案手法よりもFedSACの方が優れていることを示す。
論文 参考訳(メタデータ) (2025-03-24T01:56:30Z) - Forward Once for All: Structural Parameterized Adaptation for Efficient Cloud-coordinated On-device Recommendation [26.353286155116116]
Forward-OFAはデバイス固有のネットワークを動的に構築するための新しいアプローチである。
構築されたネットワークのパラメータに対するリアルタイム行動の構造誘導マッピングを確立する。
実世界のデータセットの実験では、Forward-OFAの有効性と効率が示されている。
論文 参考訳(メタデータ) (2025-01-06T08:32:16Z) - A-SDM: Accelerating Stable Diffusion through Model Assembly and Feature Inheritance Strategies [51.7643024367548]
安定拡散モデルは、テキスト・ツー・イメージ(T2I)と画像・ツー・イメージ(I2I)生成のための一般的かつ効果的なモデルである。
本研究では、SDMにおける冗長計算の削減と、チューニング不要とチューニング不要の両方の手法によるモデルの最適化に焦点をあてる。
論文 参考訳(メタデータ) (2024-05-31T21:47:05Z) - Over-the-Air Federated Learning and Optimization [52.5188988624998]
エッジ・ザ・エア計算(AirComp)によるフェデレーション学習(FL)に焦点を当てる。
本稿では,AirComp ベースの FedAvg (AirFedAvg) アルゴリズムの凸および非凸条件下での収束について述べる。
エッジデバイス(モデル、勾配、モデル差など)で送信できるローカルアップデートの種類によって、AirFedAvgで送信するとアグリゲーションエラーが発生する可能性がある。
さらに、より実用的な信号処理方式を検討し、通信効率を改善し、これらの信号処理方式によって引き起こされるモデル集約誤差の異なる形式に収束解析を拡張する。
論文 参考訳(メタデータ) (2023-10-16T05:49:28Z) - An Adaptive Fuzzy Reinforcement Learning Cooperative Approach for the
Autonomous Control of Flock Systems [4.961066282705832]
この研究は、群集システムの自律制御に適応的な分散ロバスト性技術を導入している。
比較的柔軟な構造は、様々な目的を同時に狙うオンラインファジィ強化学習スキームに基づいている。
動的障害に直面した場合のレジリエンスに加えて、アルゴリズムはフィードバック信号としてエージェントの位置以上のものを必要としない。
論文 参考訳(メタデータ) (2023-03-17T13:07:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。