論文の概要: Federated Multi-Agent Reinforcement Learning for Privacy-Preserving and Energy-Aware Resource Management in 6G Edge Networks
- arxiv url: http://arxiv.org/abs/2509.10163v1
- Date: Fri, 12 Sep 2025 11:41:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-15 16:03:08.06831
- Title: Federated Multi-Agent Reinforcement Learning for Privacy-Preserving and Energy-Aware Resource Management in 6G Edge Networks
- Title(参考訳): 6Gエッジネットワークにおけるプライバシ保護・エネルギー意識資源管理のためのフェデレーションマルチエージェント強化学習
- Authors: Francisco Javier Esono Nkulu Andong, Qi Min,
- Abstract要約: 第6世代(6G)ネットワークは、超高密度でインテリジェントなエッジ環境に向かっている。
厳しいプライバシー モビリティ エネルギー制約の下での資源管理が 重要になります
本稿では,フェデレート・マルチエージェント強化学習フレームワークを紹介する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As sixth-generation (6G) networks move toward ultra-dense, intelligent edge environments, efficient resource management under stringent privacy, mobility, and energy constraints becomes critical. This paper introduces a novel Federated Multi-Agent Reinforcement Learning (Fed-MARL) framework that incorporates cross-layer orchestration of both the MAC layer and application layer for energy-efficient, privacy-preserving, and real-time resource management across heterogeneous edge devices. Each agent uses a Deep Recurrent Q-Network (DRQN) to learn decentralized policies for task offloading, spectrum access, and CPU energy adaptation based on local observations (e.g., queue length, energy, CPU usage, and mobility). To protect privacy, we introduce a secure aggregation protocol based on elliptic curve Diffie Hellman key exchange, which ensures accurate model updates without exposing raw data to semi-honest adversaries. We formulate the resource management problem as a partially observable multi-agent Markov decision process (POMMDP) with a multi-objective reward function that jointly optimizes latency, energy efficiency, spectral efficiency, fairness, and reliability under 6G-specific service requirements such as URLLC, eMBB, and mMTC. Simulation results demonstrate that Fed-MARL outperforms centralized MARL and heuristic baselines in task success rate, latency, energy efficiency, and fairness, while ensuring robust privacy protection and scalability in dynamic, resource-constrained 6G edge networks.
- Abstract(参考訳): 第6世代(6G)ネットワークが超高密度でインテリジェントなエッジ環境へと移行するにつれ、厳しいプライバシ、モビリティ、エネルギー制約の下での効率的なリソース管理が重要になる。
本稿では、MAC層とアプリケーション層の両方の層間オーケストレーションを組み込んだフェデレートマルチエージェント強化学習(Federated Multi-Agent Reinforcement Learning, Fed-MARL)フレームワークを、異種エッジデバイス間のエネルギー効率、プライバシー保護、リアルタイムリソース管理のために導入する。
各エージェントは、Deep Recurrent Q-Network (DRQN)を使用して、ローカルな観測(例えば、キューの長さ、エネルギー、CPU使用量、移動量)に基づいてタスクオフロード、スペクトルアクセス、CPUエネルギー適応のための分散ポリシーを学ぶ。
プライバシ保護のために,楕円曲線Diffie Hellmanキー交換に基づくセキュアアグリゲーションプロトコルを導入する。
資源管理問題を, URLLC, eMBB, mMTCなどの6G固有のサービス要件下で, レイテンシ, エネルギー効率, スペクトル効率, 公正性, 信頼性を共同で最適化する多目的報酬関数を用いて, 部分的に観測可能なマルチエージェントマルコフ決定プロセス (POMMDP) として定式化する。
シミュレーションの結果,Fed-MARLはタスク成功率,レイテンシ,エネルギー効率,公平性において,集中型MARLやヒューリスティックベースラインよりも優れ,動的リソース制約の6Gエッジネットワークにおいて堅牢なプライバシ保護とスケーラビリティを確保していることがわかった。
関連論文リスト
- Cooperative Task Offloading through Asynchronous Deep Reinforcement Learning in Mobile Edge Computing for Future Networks [2.9057981978152116]
我々はTransformer-driven Prediction (CTO-TP) を用いたレイテンシとエネルギー効率のよい協調タスクオフロードフレームワークを提案する。
提案したCTO-TPアルゴリズムは,ベースライン方式と比較して,システム全体の80%のレイテンシと87%のエネルギー消費を削減している。
論文 参考訳(メタデータ) (2025-04-24T13:12:12Z) - Energy-Efficient Flying LoRa Gateways: A Multi-Agent Reinforcement Learning Approach [8.65375886947338]
無人航空機(UAV)に搭載された空飛ぶLoRaゲートウェイを配置し、LoRaのエンドデバイスからデータを収集し、それを中央サーバに送信する。
我々の主な目的は、送信電力、拡散係数、帯域幅、ユーザアソシエーションの合同最適化により、無線LoRaネットワークのグローバルシステムエネルギー効率を最大化することである。
論文 参考訳(メタデータ) (2025-02-05T17:16:40Z) - Secure Resource Allocation via Constrained Deep Reinforcement Learning [49.15061461220109]
リソース割り当て、タスクオフロード、セキュリティ、パフォーマンスのバランスをとるフレームワークであるSARMTOを紹介します。
SARMTOは5つのベースラインアプローチを一貫して上回り、最大40%のシステムコスト削減を実現している。
これらの拡張は、複雑な分散コンピューティング環境におけるリソース管理に革命をもたらすSARMTOの可能性を強調している。
論文 参考訳(メタデータ) (2025-01-20T15:52:43Z) - Federated Multi-Agent Deep Reinforcement Learning Approach via
Physics-Informed Reward for Multi-Microgrid Energy Management [34.18923657108073]
本稿では,物理インフォームド報酬を用いたF-MADRLアルゴリズムを提案する。
このアルゴリズムでは、F-MADRLアルゴリズムをトレーニングするためにフェデレート学習機構を導入し、データのプライバシとセキュリティを確保する。
オークリッジ国立研究所の分散エネルギー制御通信実験室(ORNL-MG)で実験を行った。
論文 参考訳(メタデータ) (2022-12-29T08:35:11Z) - Distributed Energy Management and Demand Response in Smart Grids: A
Multi-Agent Deep Reinforcement Learning Framework [53.97223237572147]
本稿では、自律制御と再生可能エネルギー資源のスマート電力グリッドシステムへの統合のための多エージェント深層強化学習(DRL)フレームワークを提案する。
特に,提案フレームワークは,住宅利用者に対する需要応答 (DR) と分散エネルギー管理 (DEM) を共同で検討している。
論文 参考訳(メタデータ) (2022-11-29T01:18:58Z) - Artificial Intelligence Empowered Multiple Access for Ultra Reliable and
Low Latency THz Wireless Networks [76.89730672544216]
テラヘルツ(THz)無線ネットワークは、第5世代(B5G)以上の時代を触媒すると予想されている。
いくつかのB5Gアプリケーションの超信頼性と低レイテンシ要求を満たすためには、新しいモビリティ管理アプローチが必要である。
本稿では、インテリジェントなユーザアソシエーションとリソースアロケーションを実現するとともに、フレキシブルで適応的なモビリティ管理を可能にする、全体論的MAC層アプローチを提案する。
論文 参考訳(メタデータ) (2022-08-17T03:00:24Z) - AI in 6G: Energy-Efficient Distributed Machine Learning for Multilayer
Heterogeneous Networks [7.318997639507269]
本稿では,ネットワーク層とエンティティにまたがるさまざまな機械学習手法に関連するタスクを分散する,階層ベースの新しいHetNetアーキテクチャを提案する。
このようなHetNetは、複数のアクセス方式と、エネルギー効率を高めるためのデバイス間通信(D2D)を備えている。
論文 参考訳(メタデータ) (2022-06-04T22:03:19Z) - Deep Reinforcement Learning Based Multidimensional Resource Management
for Energy Harvesting Cognitive NOMA Communications [64.1076645382049]
エネルギー収穫(EH)、認知無線(CR)、非直交多重アクセス(NOMA)の組み合わせはエネルギー効率を向上させるための有望な解決策である。
本稿では,決定論的CR-NOMA IoTシステムにおけるスペクトル,エネルギー,時間資源管理について検討する。
論文 参考訳(メタデータ) (2021-09-17T08:55:48Z) - Risk-Aware Energy Scheduling for Edge Computing with Microgrid: A
Multi-Agent Deep Reinforcement Learning Approach [82.6692222294594]
マイクログリッドを用いたMECネットワークにおけるリスク対応エネルギースケジューリング問題について検討する。
ニューラルネットワークを用いたマルチエージェントディープ強化学習(MADRL)に基づくアドバンテージアクター・クリティック(A3C)アルゴリズムを適用し,その解を導出する。
論文 参考訳(メタデータ) (2020-02-21T02:14:38Z) - Multi-Agent Meta-Reinforcement Learning for Self-Powered and Sustainable
Edge Computing Systems [87.4519172058185]
エッジコンピューティング機能を有するセルフパワー無線ネットワークの効率的なエネルギー分配機構について検討した。
定式化問題を解くために,新しいマルチエージェントメタ強化学習(MAMRL)フレームワークを提案する。
実験の結果、提案されたMAMRLモデルは、再生不可能なエネルギー使用量を最大11%削減し、エネルギーコストを22.4%削減できることが示された。
論文 参考訳(メタデータ) (2020-02-20T04:58:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。