論文の概要: Carbon-aware decentralized dynamic task offloading in MIMO-MEC networks via multi-agent reinforcement learning
- arxiv url: http://arxiv.org/abs/2602.18797v1
- Date: Sat, 21 Feb 2026 11:07:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.318373
- Title: Carbon-aware decentralized dynamic task offloading in MIMO-MEC networks via multi-agent reinforcement learning
- Title(参考訳): マルチエージェント強化学習によるMIMO-MECネットワークにおける炭素対応分散動的タスクオフロード
- Authors: Mubshra Zulfiqar, Muhammad Ayzed Mirza, Basit Qureshi,
- Abstract要約: 本稿では,マルチエージェントポリシー最適化に基づく炭素対応分散動的タスクオフロードフレームワークCADDTO-PPOを提案する。
このフレームワークは最低炭素強度を達成し、極端な交通負荷下では、ほぼゼロに近いオーバーフロー速度を維持する。
- 参考スコア(独自算出の注目度): 0.7373617024876725
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Massive internet of things microservices require integrating renewable energy harvesting into mobile edge computing (MEC) for sustainable eScience infrastructures. Spatiotemporal mismatches between stochastic task arrivals and intermittent green energy along with complex inter-user interference in multi-antenna (MIMO) uplinks complicate real-time resource management. Traditional centralized optimization and off-policy reinforcement learning struggle with scalability and signaling overhead in dense networks. This paper proposes CADDTO-PPO, a carbon-aware decentralized dynamic task offloading framework based on multi-agent proximal policy optimization. The multi-user MIMO-MEC system is modeled as a Decentralized Partially Observable Markov Decision Process (DEC-POMDP) to jointly minimize carbon emissions and buffer latency and energy wastage. A scalable architecture utilizes decentralized execution with parameter sharing (DEPS), which enables autonomous IoT agents to make fine-grained power control and offloading decisions based solely on local observations. Additionally, a carbon-first reward structure adaptively prioritizes green time slots for data transmission to decouple system throughput from grid-dependent carbon footprints. Finally, experimental results demonstrate CADDTO-PPO outperforms deep deterministic policy gradient (DDPG) and lyapunov-based baselines. The framework achieves the lowest carbon intensity and maintains near-zero packet overflow rates under extreme traffic loads. Architectural profiling validates the framework to demonstrate a constant $O(1)$ inference complexity and theoretical lightweight feasibility for future generation sustainable IoT deployments.
- Abstract(参考訳): マイクロサービスは、持続可能なeScienceインフラストラクチャのために、再生可能エネルギーの収穫をモバイルエッジコンピューティング(MEC)に統合する必要があります。
確率的タスク到着と間欠的グリーンエネルギーの時空間的ミスマッチと、マルチアンテナアップリンク(MIMO)における複雑なユーザ間干渉は、リアルタイムリソース管理を複雑にする。
従来の集中型最適化と非政治強化学習は、高密度ネットワークにおけるスケーラビリティとシグナルのオーバーヘッドに苦慮している。
本稿では, 炭素を意識した分散化された動的タスクオフロードフレームワークCADDTO-PPOを提案する。
マルチユーザMIMO-MECシステムは、炭素排出量とバッファ遅延とエネルギー浪費を共同で最小化する分散部分観測可能なマルコフ決定プロセス(DEC-POMDP)としてモデル化されている。
スケーラブルなアーキテクチャでは、パラメータ共有(DEPS)を備えた分散実行を利用することで、ローカル観測のみに基づいて、自律的なIoTエージェントによるきめ細かい電力制御とオフロード決定が可能になる。
さらに、カーボンファースト報酬構造は、グリッド依存の炭素フットプリントからシステムスループットを分離するために、データ伝送のグリーンタイムスロットを適応的に優先順位付けする。
最後に、CADDTO-PPOは、深い決定論的政策勾配(DDPG)とリープノフに基づくベースラインより優れることを示した。
このフレームワークは、最低炭素強度を達成し、極端な交通負荷下では、ほぼゼロに近いパケットオーバーフロー率を維持する。
アーキテクチャプロファイリング(Architectural profiling)は、将来的な持続可能なIoTデプロイメントにおいて、一定の$O(1)$推論複雑性と理論的軽量な実現可能性を示すためのフレームワークを検証する。
関連論文リスト
- TimeGNN-Augmented Hybrid-Action MARL for Fine-Grained Task Partitioning and Energy-Aware Offloading in MEC [39.30264321748534]
本稿では,複数のエッジサーバを対象とした協調計算フレームワークを提案する。
多次元サーバ状態情報の時系列をモデル化し、予測するために、時間グラフニューラルネットワーク(TimeGNN)が組み込まれている。
また、離散連続ハイブリッドアクション空間において、マルチエージェント決定論的ポリシー勾配アルゴリズム(DC-MADDPG)を導入する。
論文 参考訳(メタデータ) (2026-01-08T02:24:58Z) - A Flexible Multi-Agent Deep Reinforcement Learning Framework for Dynamic Routing and Scheduling of Latency-Critical Services [18.675072317045466]
既存のネットワーク制御ソリューションの多くは平均遅延性能のみを目標としており、厳格なEnd-to-End(E2E)ピークレイテンシ保証を提供していない。
本稿では,MA-DRL(Multi-Agent Deep Reinforcement Learning)の最近の進歩を生かして,適用期限内にパケットを確実に届けることの課題に対処する。
本稿では,集中型ルーティングと分散スケジューリングアーキテクチャを活用したMA-DRLネットワーク制御フレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-13T15:38:10Z) - Power Grid Control with Graph-Based Distributed Reinforcement Learning [60.49805771047161]
この作業は、リアルタイムでスケーラブルなグリッド管理のためのグラフベースの分散強化学習フレームワークを前進させる。
グラフニューラルネットワーク(GNN)を使用して、ネットワークのトポロジ情報を単一の低レベルエージェントの観測内にエンコードする。
Grid2Opシミュレーション環境での実験は、このアプローチの有効性を示している。
論文 参考訳(メタデータ) (2025-09-02T22:17:25Z) - PowerGrow: Feasible Co-Growth of Structures and Dynamics for Power Grid Synthesis [75.14189839277928]
本稿では,運用効率を維持しながら計算オーバーヘッドを大幅に削減する,共同生成フレームワークPowerGrowを提案する。
ベンチマーク設定による実験では、PowerGrowはフィデリティと多様性において、事前の拡散モデルよりも優れていた。
これは、運用上有効で現実的な電力グリッドシナリオを生成する能力を示している。
論文 参考訳(メタデータ) (2025-08-29T01:47:27Z) - Hierarchical Multi-Agent Framework for Carbon-Efficient Liquid-Cooled Data Center Clusters [5.335496791443277]
本稿では,Reinforcement Learning (RL) に基づく階層型コントローラを提案するGreen-DCCについて紹介する。
本稿では,複数のデータセンターを同期的に最適化し,デジタル双生児を対象とし,炭素排出量とサステナビリティ指標に基づく様々なRL手法の性能比較を行う。
論文 参考訳(メタデータ) (2025-02-12T12:00:58Z) - SCALE: Self-regulated Clustered federAted LEarning in a Homogeneous Environment [4.925906256430176]
フェデレートラーニング(FL)は、ユーザのプライバシを維持しながら、分散機械学習を実現するための変革的なアプローチとして登場した。
本稿では,エッジサーバへの依存を排除し,これらの制約を克服する新しいFL手法を提案する。
論文 参考訳(メタデータ) (2024-07-25T20:42:16Z) - Multiagent Reinforcement Learning with an Attention Mechanism for
Improving Energy Efficiency in LoRa Networks [52.96907334080273]
ネットワーク規模が大きくなるにつれて、パケット衝突によるLoRaネットワークのエネルギー効率は急激に低下する。
マルチエージェント強化学習(MALoRa)に基づく伝送パラメータ割り当てアルゴリズムを提案する。
シミュレーションの結果,MALoRaはベースラインアルゴリズムと比較してシステムEEを著しく改善することがわかった。
論文 参考訳(メタデータ) (2023-09-16T11:37:23Z) - Collaborative Intelligent Reflecting Surface Networks with Multi-Agent
Reinforcement Learning [63.83425382922157]
インテリジェント・リフレクション・サーフェス(IRS)は将来の無線ネットワークに広く応用されることが想定されている。
本稿では,エネルギー収穫能力を備えた協調型IRSデバイスを用いたマルチユーザ通信システムについて検討する。
論文 参考訳(メタデータ) (2022-03-26T20:37:14Z) - Adaptive Stochastic ADMM for Decentralized Reinforcement Learning in
Edge Industrial IoT [106.83952081124195]
強化学習 (Reinforcement Learning, RL) は, 意思決定および最適制御プロセスのための有望な解法として広く研究されている。
本稿では,Adaptive ADMM (asI-ADMM)アルゴリズムを提案する。
実験の結果,提案アルゴリズムは通信コストやスケーラビリティの観点から技術状況よりも優れており,複雑なIoT環境に適応できることがわかった。
論文 参考訳(メタデータ) (2021-06-30T16:49:07Z) - Multi-Agent Meta-Reinforcement Learning for Self-Powered and Sustainable
Edge Computing Systems [87.4519172058185]
エッジコンピューティング機能を有するセルフパワー無線ネットワークの効率的なエネルギー分配機構について検討した。
定式化問題を解くために,新しいマルチエージェントメタ強化学習(MAMRL)フレームワークを提案する。
実験の結果、提案されたMAMRLモデルは、再生不可能なエネルギー使用量を最大11%削減し、エネルギーコストを22.4%削減できることが示された。
論文 参考訳(メタデータ) (2020-02-20T04:58:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。