論文の概要: Heterogeneous AAV Logistics Task Allocation: A Reinforcement Learning Enhanced Overlapping Coalition Formation Game Approach
- arxiv url: http://arxiv.org/abs/2605.26471v1
- Date: Tue, 26 May 2026 02:28:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.583344
- Title: Heterogeneous AAV Logistics Task Allocation: A Reinforcement Learning Enhanced Overlapping Coalition Formation Game Approach
- Title(参考訳): 不均質なAAVロジスティックスタスクアロケーション: 重畳重畳み合わせ型ゲームアプローチによる強化学習
- Authors: Yuze Zhou, Jingliang Sun, Junzhi Li, Jianxin Zhong, Zihan Wang, Teng Long,
- Abstract要約: 時間に敏感なタスクは、異種AAVのロジスティクスタスク割り当てにおいて重要な最適性課題となる。
連立ゲームに重なる強化学習を提案する。
数値シミュレーションにより,提案アルゴリズムはタスク割り当ての最適性を効果的に向上することを示した。
- 参考スコア(独自算出の注目度): 9.382997518159444
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In dynamic urban logistics, the stochastic emergence of time-sensitive tasks poses a significant optimality challenge for heterogeneous AAVs logistics task allocation. To address this problem, a reinforcement learning enhanced overlapping coalition formation game approach is proposed. A dynamic task allocation model is established, where global optimality is mathematically quantified by a generalized logistics cost coupling service quality and resource consumption. To deal with the time-varying task sets induced by stochastic order arrivals, a transformer-based soft actor-critic network is designed. By leveraging multi-head self-attention to encode variable-length logistics states and capture task-wise spatiotemporal dependencies, the learned policy adaptively guides coalition updates, replacing heuristic rules in the overlapping coalition formation game. On this basis, heterogeneous AAVs can form more efficient overlapping coalitions for dynamic logistics tasks. The resulting coalition formation process is proven to constitute an exact potential game, which guarantees convergence to a Nash-stable equilibrium within a finite number of iterations. Numerical simulations demonstrate that the proposed algorithm effectively improves the optimality of task allocation under the generalized logistics cost criterion. In a scenario with 32 AAVs and 80 tasks, our algorithm achieves a 39.76% cost reduction compared with the heuristic OCF baseline. Indoor flight experiments further validate its practicality.
- Abstract(参考訳): 動的都市ロジスティクスにおいて、時間に敏感なタスクの確率的出現は、異種AAVのロジスティクスタスク割り当てに重大な最適性をもたらす。
この問題に対処するために,強化学習により重なり合う連立ゲーム手法を提案する。
動的タスク割り当てモデルを確立し、グローバルな最適性を一般化された物流コスト結合サービス品質と資源消費によって数学的に定量化する。
確率的オーダー到着によって引き起こされる時間変化タスクセットに対処するため、トランスフォーマーベースのソフトアクタ-クリティカルネットワークを設計する。
可変長のロジスティクス状態の符号化とタスクワイズ時空間依存性のキャプチャにマルチヘッド自己注意を活用することで、学習ポリシは、重複する連立形成ゲームにおけるヒューリスティックルールを置き換えることにより、連立更新を適応的にガイドする。
この基礎から、異種AAVは動的ロジスティクスタスクにおいてより効率的な重なり合う連星を形成することができる。
結果として生じる連立の形成過程は、有限個のイテレーション内でのナッシュ安定平衡への収束を保証する、正確なポテンシャルゲームを構成することが証明されている。
数値シミュレーションにより,提案アルゴリズムは汎用物流コスト基準の下でのタスク割り当ての最適性を効果的に向上することを示した。
32のAVと80のタスクを持つシナリオでは、このアルゴリズムはヒューリスティックなOCFベースラインと比較して39.76%のコスト削減を実現している。
室内での飛行実験は、その実用性をさらに検証する。
関連論文リスト
- QoS-Aware Hierarchical Reinforcement Learning for Joint Link Selection and Trajectory Optimization in SAGIN-Supported UAV Mobility Management [52.15690855486153]
宇宙空間統合ネットワーク (SAGIN) がユビキタスUAV接続を実現するための重要なアーキテクチャとして登場した。
本稿では,SAGINにおけるUAVモビリティ管理を制約付き多目的関節最適化問題として定式化する。
論文 参考訳(メタデータ) (2025-12-17T06:22:46Z) - Hierarchical Task Offloading and Trajectory Optimization in Low-Altitude Intelligent Networks Via Auction and Diffusion-based MARL [37.79695337425523]
低高度インテリジェントネットワーク(LAIN)は、災害対応、環境モニタリング、リアルタイムセンシングといったミッションクリティカルなアプリケーションをサポートすることができる。
これらのシステムは、エネルギー制約のあるUAV、タスク到着、異種コンピューティングリソースなど、重要な課題に直面している。
本稿では,UAV軌道計画とタスクオフロード決定を協調的に最適化する,時間依存型整数型非線形計画問題の解法を提案する。
論文 参考訳(メタデータ) (2025-12-05T08:14:45Z) - CoT-Saliency: Unified Chain-of-Thought Reasoning for Heterogeneous Saliency Tasks [96.64597365827046]
本稿では,3つの運用上不均一なサリエンシタスクを共同で処理する,最初の統合フレームワークを提案する。
タスクの不均一性を橋渡しする視覚言語モデル(VLM)において、チェーン・オブ・ソート(CoT)推論プロセスを導入する。
我々は,全タスクにまたがる特別なSOTA手法と強力なクローズドソースVLMの整合性を示す。
論文 参考訳(メタデータ) (2025-11-01T04:37:01Z) - BOTS: A Unified Framework for Bayesian Online Task Selection in LLM Reinforcement Finetuning [82.925106913459]
強化微調整(Reinforcement Finetuning, RFT)は、大規模言語モデル(LLM)を人間の嗜好と整合させ、推論を強化するための重要な手法である。
RFT強化微調整におけるベイズオンラインタスク選択のための統合フレームワークBOTSを紹介する。
論文 参考訳(メタデータ) (2025-10-30T11:15:23Z) - LLM Meets the Sky: Heuristic Multi-Agent Reinforcement Learning for Secure Heterogeneous UAV Networks [57.27815890269697]
この研究は、エネルギー制約下での不均一なUAVネットワーク(HetUAVN)における機密率の最大化に焦点を当てている。
本稿では,Large Language Model (LLM) を用いたマルチエージェント学習手法を提案する。
その結果,本手法は機密性やエネルギー効率において,既存のベースラインよりも優れていた。
論文 参考訳(メタデータ) (2025-07-23T04:22:57Z) - Hierarchical Task Offloading for UAV-Assisted Vehicular Edge Computing via Deep Reinforcement Learning [11.695622067301128]
部分オフロードに基づく2層UAV支援エッジコンピューティングアーキテクチャを提案する。
提案アーキテクチャは異種資源の効率的な統合と調整を可能にする。
提案手法は,タスク完了率,システム効率,収束速度において,いくつかのベースラインを上回っていることを示す。
論文 参考訳(メタデータ) (2025-07-08T07:10:52Z) - A Multi-Agent Reinforcement Learning Approach for Cooperative Air-Ground-Human Crowdsensing in Emergency Rescue [22.201769922727077]
本稿では,ヒト,UAV,UGVを考慮し,不均一な協調作業割当問題に対処する。
我々は,UGVが低電池UAVのチャージを優先し,検知タスクを遂行する,新しい「ハード・コラボレーティブ」政策を導入する。
本稿では,分散実行アーキテクチャに基づく新しいマルチエージェント強化学習アルゴリズムであるHECTA4ERを提案する。
論文 参考訳(メタデータ) (2025-05-11T14:49:15Z) - Preventing Local Pitfalls in Vector Quantization via Optimal Transport [77.15924044466976]
我々はシンクホーンアルゴリズムを用いて最適な輸送問題を最適化する新しいベクトル量子化法であるOptVQを紹介する。
画像再構成タスクの実験では,OptVQが100%のコードブック利用を実現し,現在最先端のVQNを超越していることが示された。
論文 参考訳(メタデータ) (2024-12-19T18:58:14Z) - Cluster-Based Multi-Agent Task Scheduling for Space-Air-Ground Integrated Networks [60.085771314013044]
低高度経済は、コミュニケーションやセンシングなどの分野で発展する大きな可能性を秘めている。
本稿では,SAGINにおけるマルチUAV協調タスクスケジューリング問題に対処するため,クラスタリングに基づく多エージェントDeep Deterministic Policy Gradient (CMADDPG)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-12-14T06:17:33Z) - Dependency-Aware CAV Task Scheduling via Diffusion-Based Reinforcement Learning [12.504232513881828]
動的無人航空機支援型コネクテッド自動運転車(CAV)のための新しい依存性を考慮したタスクスケジューリング手法を提案する。
平均タスク完了時間を最小化することを目的として,共同スケジューリング優先度とサブタスク割り当て最適化問題を定式化する。
本稿では,Synthetic DDQNをベースとしたSubtasks Schedulingという拡散型強化学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-11-27T11:07:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。