論文の概要: Quantum-Inspired Multi Agent Reinforcement Learning for Exploration Exploitation Optimization in UAV-Assisted 6G Network Deployment
- arxiv url: http://arxiv.org/abs/2512.20624v1
- Date: Tue, 25 Nov 2025 04:35:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-29 00:37:57.088485
- Title: Quantum-Inspired Multi Agent Reinforcement Learning for Exploration Exploitation Optimization in UAV-Assisted 6G Network Deployment
- Title(参考訳): UAV支援6Gネットワーク展開における探索爆発最適化のための量子誘導型マルチエージェント強化学習
- Authors: Mazyar Taghavi, Javad Vahidi,
- Abstract要約: 本研究では,UAVa支援6Gネットワーク展開に適用したマルチエージェント学習における探索エクスプロイトトレードオフを最適化するための量子インスパイアフレームワークを提案する。
10機のインテリジェントUAVが自律的に協調して信号カバレッジを最大化し、部分観測性と動的条件下での効率的なネットワーク拡張を支援することを考える。
- 参考スコア(独自算出の注目度): 0.5729426778193399
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This study introduces a quantum inspired framework for optimizing the exploration exploitation tradeoff in multiagent reinforcement learning, applied to UAVassisted 6G network deployment. We consider a cooperative scenario where ten intelligent UAVs autonomously coordinate to maximize signal coverage and support efficient network expansion under partial observability and dynamic conditions. The proposed approach integrates classical MARL algorithms with quantum-inspired optimization techniques, leveraging variational quantum circuits VQCs as the core structure and employing the Quantum Approximate Optimization Algorithm QAOA as a representative VQC based method for combinatorial optimization. Complementary probabilistic modeling is incorporated through Bayesian inference, Gaussian processes, and variational inference to capture latent environmental dynamics. A centralized training with decentralized execution CTDE paradigm is adopted, where shared memory and local view grids enhance local observability among agents. Comprehensive experiments including scalability tests, sensitivity analysis, and comparisons with PPO and DDPG baselines demonstrate that the proposed framework improves sample efficiency, accelerates convergence, and enhances coverage performance while maintaining robustness. Radar chart and convergence analyses further show that QI MARL achieves a superior balance between exploration and exploitation compared to classical methods. All implementation code and supplementary materials are publicly available on GitHub to ensure reproducibility.
- Abstract(参考訳): 本研究では,UAVa支援6Gネットワーク展開に適用したマルチエージェント強化学習における探索エクスプロイトトレードオフを最適化するための量子インスパイアフレームワークを提案する。
10機のインテリジェントUAVが自律的に協調して信号カバレッジを最大化し、部分観測可能性および動的条件下での効率的なネットワーク拡張をサポートする、協調的なシナリオを考える。
提案手法は,古典的MARLアルゴリズムと量子インスパイアされた最適化手法を統合し,変分量子回路VQCをコア構造として利用し,組合せ最適化のための代表的なVQC法として量子近似最適化アルゴリズムQAOAを用いる。
補完確率的モデリングは、ベイズ的推論、ガウス的過程、および変動的推論を通じて、潜伏環境力学を捉える。
分散実行CTDEパラダイムを用いた集中型トレーニングが採用され、共有メモリとローカルビューグリッドがエージェント間のローカルオブザーバビリティを高める。
拡張性試験,感度解析,PPOおよびDDPGベースラインとの比較を含む総合的な実験により,提案フレームワークは試料効率を改善し,収束を加速し,堅牢性を維持しながらカバレッジ性能を向上させる。
レーダチャートと収束解析により、QI MARLは古典的手法に比べて探索と搾取のバランスが優れていることが示された。
再現性を確保するため、すべての実装コードと補足資料がGitHubで公開されている。
関連論文リスト
- QoS-Aware Hierarchical Reinforcement Learning for Joint Link Selection and Trajectory Optimization in SAGIN-Supported UAV Mobility Management [52.15690855486153]
宇宙空間統合ネットワーク (SAGIN) がユビキタスUAV接続を実現するための重要なアーキテクチャとして登場した。
本稿では,SAGINにおけるUAVモビリティ管理を制約付き多目的関節最適化問題として定式化する。
論文 参考訳(メタデータ) (2025-12-17T06:22:46Z) - Sum Rate Maximization in STAR-RIS-UAV-Assisted Networks: A CA-DDPG Approach for Joint Optimization [12.38744459760065]
本稿では,STAR-RIS-UAV支援無線通信システムのスペクトル効率を最適化するための無人航空機(UAV)を提案する。
本稿では,ビームフォーミング,位相シフト,UAV位置を反復的に最適化し,環境との連続的な相互作用を通じてシステムの総和率を最大化する深部強化学習(DRL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-12-01T02:36:00Z) - Heterogeneous Multi-agent Collaboration in UAV-assisted Mobile Crowdsensing Networks [6.226837215382989]
無人航空機(UAV)による移動式クラウドセンシング(MCS)は,データ収集において有望なパラダイムとして浮上している。
我々は,センサ,通信,資源配分の効率的な調整を妨げる,スペクトル不足,デバイス計算,ユーザモビリティといった課題に対処する。
論文 参考訳(メタデータ) (2025-09-28T02:13:19Z) - Pareto Actor-Critic for Communication and Computation Co-Optimization in Non-Cooperative Federated Learning Services [18.291028557265864]
ゲーム理論によるマルチエージェント強化学習(MARL)フレームワークであるPAC-MCoFLを導入する。
PAC-MCoFL-p はパラメータ化予測生成器を特徴とするスケーラブルな変種であり,有界な誤差で計算複雑性を著しく低減する。
論文 参考訳(メタデータ) (2025-08-22T02:09:48Z) - A Survey on Inference Optimization Techniques for Mixture of Experts Models [50.40325411764262]
大規模Mixture of Experts(MoE)モデルは、条件計算によるモデル容量と計算効率の向上を提供する。
これらのモデル上で推論をデプロイし実行することは、計算資源、レイテンシ、エネルギー効率において大きな課題を示す。
本調査では,システムスタック全体にわたるMoEモデルの最適化手法について分析する。
論文 参考訳(メタデータ) (2024-12-18T14:11:15Z) - Generative AI for O-RAN Slicing: A Semi-Supervised Approach with VAE and Contrastive Learning [5.1435595246496595]
本稿では,O-RANにおける資源割り当てとネットワークスライシングを最適化する,新しい生成型AI(GAI)による半教師付き学習アーキテクチャを提案する。
本稿では,eMBB と URLLC サービスの質を高めるために,ユーザ機器のスループット(UE)を最大化し,物理リソースブロック(PRB)を割り当てる。
論文 参考訳(メタデータ) (2024-01-16T22:23:27Z) - Pointer Networks with Q-Learning for Combinatorial Optimization [55.2480439325792]
我々は、モデルフリーQ値ポリシー近似をPointer Networks(Ptr-Nets)と統合したハイブリッドニューラルネットワークであるPointer Q-Network(PQN)を紹介する。
実験により,本手法の有効性を実証し,不安定な環境でモデルをテストする。
論文 参考訳(メタデータ) (2023-11-05T12:03:58Z) - Federated Conditional Stochastic Optimization [110.513884892319]
条件付き最適化は、不変学習タスク、AUPRC、AMLなど、幅広い機械学習タスクで見られる。
本稿では,分散フェデレーション学習のためのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-10-04T01:47:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。