論文の概要: Hierarchical Reinforcement Learning for Cooperative Air-Ground Delivery in Urban System
- arxiv url: http://arxiv.org/abs/2602.12913v1
- Date: Fri, 13 Feb 2026 13:19:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-16 23:37:53.960458
- Title: Hierarchical Reinforcement Learning for Cooperative Air-Ground Delivery in Urban System
- Title(参考訳): 都市システムにおける協調型空域輸送のための階層型強化学習
- Authors: Songxin Lei, Chunming Ma, Haomin Wen, Yexin Li, Lizhenghe Chen, Qianyu Yang, Fugee Tsung, Lei Chen, Sijie Ruan, Yuxuan Liang,
- Abstract要約: 本研究では,階層型強化学習フレームワークHRL4AGを提案する。
具体的には、HRL4AGは高レベルのマネージャを使用して、共同アクション空間を分解することでスケーラビリティのボトルネックに取り組む。
2つの実世界のデータセットと評価プラットフォームの実験は、HRL4AGが最先端のベースラインを大幅に上回ることを示した。
- 参考スコア(独自算出の注目度): 41.96919926267983
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cooperative air-ground delivery has emerged as a promising logistics paradigm by leveraging the complementary strengths of UAVs and ground carriers. However, effective dispatching in such heterogeneous systems faces two critical challenges: i) the heterogeneity between flight and road dynamics, ii) the scalability bottleneck raised by the exponential decision variables in large-scale fleets. To address these challenges, we propose HRL4AG, a Hierarchical Reinforcement Learning framework for cooperative Air-Ground delivery. Specifically, HRL4AG employs a high-level manager to tackle the scalability bottleneck by decomposing the joint action space, and mode-specific workers that encode distinct flight and road dynamics to address the heterogeneity. Furthermore, a novel internal reward mechanism is designed to guide the hierarchical policy learning, addressing the credit assignment problem in sparse-reward settings. Extensive experiments on two real-world datasets and an evaluation platform demonstrate that HRL4AG significantly outperforms state-of-the-art baselines, improving the delivery success rate by up to 26% while achieving an 80-fold increase in computational efficiency.
- Abstract(参考訳): 航空母艦と地上空母の相補的な強みを活かして、共同空輸が有望な物流パラダイムとして浮上している。
しかし、このような異種システムにおける効果的なディスパッチは2つの重要な課題に直面している。
一 飛行と道路力学の不均一性
二 大規模艦隊における指数的決定変数によるスケーラビリティのボトルネック
これらの課題に対処するため,協調型エアグラウンド配信のための階層型強化学習フレームワークHRL4AGを提案する。
具体的には、HRL4AGは、統合アクション空間を分解することでスケーラビリティのボトルネックに取り組むために高レベルのマネージャを使用し、異種性に対処するために、異なる飛行と道路のダイナミクスをエンコードするモード固有のワーカーを使用する。
さらに、階層的な政策学習を誘導する新たな内部報酬機構を設計し、スパース・リワード設定における信用割当問題に対処する。
2つの実世界のデータセットと評価プラットフォームに関する大規模な実験により、HRL4AGは最先端のベースラインを著しく上回り、デリバリ成功率を最大26%改善し、80倍の計算効率の向上を実現している。
関連論文リスト
- OmniVL-Guard: Towards Unified Vision-Language Forgery Detection and Grounding via Balanced RL [63.388513841293616]
既存の偽造検出手法は、現実世界の誤報に多いインターリーブされたテキスト、画像、ビデオを扱うのに失敗する。
このギャップを埋めるため,本論文では,オムニバス・ビジョン言語による偽造検出と接地のための統一フレームワークの開発を目標としている。
我々は、OmniVL-Guardという、オムニバス視覚言語による偽造検出と接地のためのバランスの取れた強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-11T09:41:36Z) - QoS-Aware Hierarchical Reinforcement Learning for Joint Link Selection and Trajectory Optimization in SAGIN-Supported UAV Mobility Management [52.15690855486153]
宇宙空間統合ネットワーク (SAGIN) がユビキタスUAV接続を実現するための重要なアーキテクチャとして登場した。
本稿では,SAGINにおけるUAVモビリティ管理を制約付き多目的関節最適化問題として定式化する。
論文 参考訳(メタデータ) (2025-12-17T06:22:46Z) - AirFed: Federated Graph-Enhanced Multi-Agent Reinforcement Learning for Multi-UAV Cooperative Mobile Edge Computing [21.4907371859268]
複数の無人航空機(UAV)協調移動エッジコンピューティング(MEC)システムは、軌道計画、タスクオフロード、リソース割り当ての調整において重要な課題に直面している。
既存のアプローチは、スケーラビリティの制限、収束の遅さ、UAV間の非効率な知識共有に悩まされている。
本稿では,新しい多エージェント強化学習フレームワークであるAirFedを提案する。
論文 参考訳(メタデータ) (2025-10-27T06:31:35Z) - STAR-RIS-assisted Collaborative Beamforming for Low-altitude Wireless Networks [58.13757830013997]
無人航空機(UAV)に基づく無線ネットワークは、都市コミュニケーションに高いモビリティ、柔軟性、カバーを提供する。
閉塞により、密集した環境では信号の減衰が激しい。
この重要な問題に対処するために、UAVの協調ビームの導入と全方向逆方向ビームフォーミングについて検討する。
論文 参考訳(メタデータ) (2025-10-25T01:28:37Z) - CoordField: Coordination Field for Agentic UAV Task Allocation In Low-altitude Urban Scenarios [18.95579655633218]
CoordFieldは、複雑な都市シナリオにおける異種ドローン群をコーディネートするための調整フィールドエージェントシステムである。
LLMは、高レベルの人間の命令を解釈し、それをUAVスワムの実行可能なコマンドに変換する役割を担っている。
UAV動作とタスク選択を誘導するコーディネーションフィールド機構を提案し,創発的タスクの分散および適応的アロケーションを可能にする。
論文 参考訳(メタデータ) (2025-04-30T18:02:45Z) - Cluster-Based Multi-Agent Task Scheduling for Space-Air-Ground Integrated Networks [60.085771314013044]
低高度経済は、コミュニケーションやセンシングなどの分野で発展する大きな可能性を秘めている。
本稿では,SAGINにおけるマルチUAV協調タスクスケジューリング問題に対処するため,クラスタリングに基づく多エージェントDeep Deterministic Policy Gradient (CMADDPG)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-12-14T06:17:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。