論文の概要: TimeGNN-Augmented Hybrid-Action MARL for Fine-Grained Task Partitioning and Energy-Aware Offloading in MEC
- arxiv url: http://arxiv.org/abs/2601.06191v1
- Date: Thu, 08 Jan 2026 02:24:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:00.662342
- Title: TimeGNN-Augmented Hybrid-Action MARL for Fine-Grained Task Partitioning and Energy-Aware Offloading in MEC
- Title(参考訳): MECにおける細粒化タスク分割と省エネオフロードのためのTimeGNN-Augmented Hybrid-Action MARL
- Authors: Wei Ai, Yun Peng, Yuntao Shou, Tao Meng, Keqin Li,
- Abstract要約: 本稿では,複数のエッジサーバを対象とした協調計算フレームワークを提案する。
多次元サーバ状態情報の時系列をモデル化し、予測するために、時間グラフニューラルネットワーク(TimeGNN)が組み込まれている。
また、離散連続ハイブリッドアクション空間において、マルチエージェント決定論的ポリシー勾配アルゴリズム(DC-MADDPG)を導入する。
- 参考スコア(独自算出の注目度): 39.30264321748534
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the rapid growth of IoT devices and latency-sensitive applications, the demand for both real-time and energy-efficient computing has surged, placing significant pressure on traditional cloud computing architectures. Mobile edge computing (MEC), an emerging paradigm, effectively alleviates the load on cloud centers and improves service quality by offloading computing tasks to edge servers closer to end users. However, the limited computing resources, non-continuous power provisioning (e.g., battery-powered nodes), and highly dynamic systems of edge servers complicate efficient task scheduling and resource allocation. To address these challenges, this paper proposes a multi-agent deep reinforcement learning algorithm, TG-DCMADDPG, and constructs a collaborative computing framework for multiple edge servers, aiming to achieve joint optimization of fine-grained task partitioning and offloading. This approach incorporates a temporal graph neural network (TimeGNN) to model and predict time series of multi-dimensional server state information, thereby reducing the frequency of online interactions and improving policy predictability. Furthermore, a multi-agent deterministic policy gradient algorithm (DC-MADDPG) in a discrete-continuous hybrid action space is introduced to collaboratively optimize task partitioning ratios, transmission power, and priority scheduling strategies. Extensive simulation experiments confirm that TG-DCMADDPG achieves markedly faster policy convergence, superior energy-latency optimization, and higher task completion rates compared with existing state-of-the-art methods, underscoring its robust scalability and practical effectiveness in dynamic and constrained MEC scenarios.
- Abstract(参考訳): IoTデバイスとレイテンシに敏感なアプリケーションの急激な成長に伴い、リアルタイムコンピューティングとエネルギー効率の両面での需要が急増し、従来のクラウドコンピューティングアーキテクチャに大きな圧力がかかっている。
新興パラダイムであるモバイルエッジコンピューティング(MEC)は、クラウドコンピューティングタスクをエンドユーザに近いエッジサーバにオフロードすることで、クラウド上の負荷を効果的に軽減し、サービス品質を改善する。
しかし、コンピューティングリソースの制限、非連続的な電力供給(例えば、バッテリ駆動ノード)、エッジサーバの高度に動的なシステムは、効率的なタスクスケジューリングとリソース割り当てを複雑にする。
これらの課題に対処するために,マルチエージェント深部強化学習アルゴリズムTG-DCMADDPGを提案し,細粒度タスク分割とオフロードの協調最適化を実現することを目的とした,複数エッジサーバのための協調コンピューティングフレームワークを構築した。
このアプローチでは、時間グラフニューラルネットワーク(TimeGNN)を用いて、多次元サーバ状態情報の時系列をモデル化し、予測することで、オンラインインタラクションの頻度を低減し、ポリシー予測可能性を向上させる。
さらに、離散連続ハイブリッド行動空間におけるマルチエージェント決定論的ポリシー勾配アルゴリズム(DC-MADDPG)を導入し、タスク分割率、送信電力、優先度スケジューリング戦略を協調的に最適化する。
大規模シミュレーション実験により、TG-DCMADDPGは、既存の最先端手法と比較して、極めて高速なポリシー収束、優れたエネルギーレイテンシ最適化、タスク完了率を実現し、動的および制約されたMECシナリオにおける堅牢なスケーラビリティと実践的有効性を実証した。
関連論文リスト
- Cost Minimization for Space-Air-Ground Integrated Multi-Access Edge Computing Systems [60.586531406445744]
宇宙空間統合多高度エッジコンピューティング(SAGIN-MEC)は、急速に発展する低高度経済に有望なソリューションを提供する。
本稿では、ユーザデバイス(UD)、無人航空機(UAV)、衛星間の協調を可能にするSAGIN-MECアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-10-24T15:03:07Z) - Enhanced Evolutionary Multi-Objective Deep Reinforcement Learning for Reliable and Efficient Wireless Rechargeable Sensor Networks [44.91945854166524]
ワイヤレス充電式センサネットワーク(WRSN)とモバイル充電機能は、ネットワーク寿命を延ばすための有望なソリューションを提供する。
WRSNは、ノード生存率の最大化と充電エネルギー効率の最大化の間の本質的にのトレードオフから、重要な課題に直面している。
論文 参考訳(メタデータ) (2025-10-24T03:30:00Z) - CollaPipe: Adaptive Segment-Optimized Pipeline Parallelism for Collaborative LLM Training in Heterogeneous Edge Networks [57.95170323315603]
CollaPipeは、コラボレーティブパイプライン並列性とフェデレーションアグリゲーションを統合し、自己進化型ネットワークをサポートする分散学習フレームワークである。
CollaPipeでは、エンコーダ部分は可変サイズのセグメントに適応的に分割され、パイプライン並列トレーニングのためにモバイルデバイスにデプロイされ、デコーダは生成タスクを処理するためにエッジサーバにデプロイされる。
トレーニング効率を向上させるために,モデルセグメント,マイクロバッチ,帯域幅,送信電力を適応的に割り当てる共同最適化問題を定式化する。
論文 参考訳(メタデータ) (2025-09-24T07:54:01Z) - CSGO: Generalized Optimization for Cold Start in Wireless Collaborative Edge LLM Systems [62.24576366776727]
本稿では,全体の推論遅延を最小限に抑えるために,遅延を考慮したスケジューリングフレームワークを提案する。
提案手法は,ベースライン戦略と比較して,コールドスタート遅延を著しく低減することを示す。
論文 参考訳(メタデータ) (2025-08-15T07:49:22Z) - Cooperative Task Offloading through Asynchronous Deep Reinforcement Learning in Mobile Edge Computing for Future Networks [2.9057981978152116]
我々はTransformer-driven Prediction (CTO-TP) を用いたレイテンシとエネルギー効率のよい協調タスクオフロードフレームワークを提案する。
提案したCTO-TPアルゴリズムは,ベースライン方式と比較して,システム全体の80%のレイテンシと87%のエネルギー消費を削減している。
論文 参考訳(メタデータ) (2025-04-24T13:12:12Z) - Reinforcement Learning Controlled Adaptive PSO for Task Offloading in IIoT Edge Computing [0.0]
産業用IoT(Industrial Internet of Things)アプリケーションは、低レイテンシで重いデータ負荷を処理するために、効率的なタスクオフロードを要求する。
モバイルエッジコンピューティング(MEC)は、レイテンシとサーバ負荷を低減するために、デバイスに計算を近づける。
本稿では,適応粒子群最適化(APSO)と強化学習,特にソフトアクタ批判(SAC)を組み合わせた新しい解を提案する。
論文 参考訳(メタデータ) (2025-01-25T13:01:54Z) - Secure Resource Allocation via Constrained Deep Reinforcement Learning [49.15061461220109]
リソース割り当て、タスクオフロード、セキュリティ、パフォーマンスのバランスをとるフレームワークであるSARMTOを紹介します。
SARMTOは5つのベースラインアプローチを一貫して上回り、最大40%のシステムコスト削減を実現している。
これらの拡張は、複雑な分散コンピューティング環境におけるリソース管理に革命をもたらすSARMTOの可能性を強調している。
論文 参考訳(メタデータ) (2025-01-20T15:52:43Z) - Collaborative Intelligent Reflecting Surface Networks with Multi-Agent
Reinforcement Learning [63.83425382922157]
インテリジェント・リフレクション・サーフェス(IRS)は将来の無線ネットワークに広く応用されることが想定されている。
本稿では,エネルギー収穫能力を備えた協調型IRSデバイスを用いたマルチユーザ通信システムについて検討する。
論文 参考訳(メタデータ) (2022-03-26T20:37:14Z) - Reinforcement Learning on Computational Resource Allocation of
Cloud-based Wireless Networks [22.06811314358283]
IoT(Internet of Things)に使用される無線ネットワークには、主にクラウドベースのコンピューティングと処理が関与することが期待されている。
クラウド環境では、プロセスのパフォーマンスを維持しながらエネルギーを節約するために、動的計算資源割り当てが不可欠である。
本稿では、この動的計算資源割当問題をマルコフ決定プロセス(MDP)にモデル化し、CPU使用量の動的リソース割当を最適化するためのモデルベース強化学習エージェントを設計する。
その結果, エージェントは最適方針に迅速に収束し, 異なる設定で安定して動作し, 性能が良く, あるいは少なくとも等しく動作し, 異なるシナリオでの省エネにおけるベースラインアルゴリズムと比較した。
論文 参考訳(メタデータ) (2020-10-10T15:16:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。