論文の概要: Multi-Agent Reinforcement Learning for Task Offloading in Wireless Edge Networks
- arxiv url: http://arxiv.org/abs/2509.01257v1
- Date: Mon, 01 Sep 2025 08:47:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.606885
- Title: Multi-Agent Reinforcement Learning for Task Offloading in Wireless Edge Networks
- Title(参考訳): 無線エッジネットワークにおけるタスクオフロードのためのマルチエージェント強化学習
- Authors: Andrea Fox, Francesco De Pellegrini, Eitan Altman,
- Abstract要約: エッジコンピューティングシステムでは、自律エージェントは共有リソースを競いながら、高速なローカル決定をしなければならない。
本稿では,各エージェントが制約付きマルコフ決定プロセス(CMDP)を解き,共有制約ベクトルを通じて暗黙的にコーディネートする分散フレームワークを提案する。
安全強化学習を用いて、エージェントは、地域とグローバルの両方の目標を満たすポリシーを学ぶ。
- 参考スコア(独自算出の注目度): 3.065057842316041
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In edge computing systems, autonomous agents must make fast local decisions while competing for shared resources. Existing MARL methods often resume to centralized critics or frequent communication, which fail under limited observability and communication constraints. We propose a decentralized framework in which each agent solves a constrained Markov decision process (CMDP), coordinating implicitly through a shared constraint vector. For the specific case of offloading, e.g., constraints prevent overloading shared server resources. Coordination constraints are updated infrequently and act as a lightweight coordination mechanism. They enable agents to align with global resource usage objectives but require little direct communication. Using safe reinforcement learning, agents learn policies that meet both local and global goals. We establish theoretical guarantees under mild assumptions and validate our approach experimentally, showing improved performance over centralized and independent baselines, especially in large-scale settings.
- Abstract(参考訳): エッジコンピューティングシステムでは、自律エージェントは共有リソースを競いながら、高速なローカル決定をしなければならない。
既存のMARL法は、しばしば中央集権的な批評家や頻繁なコミュニケーションに再開するが、これは可観測性や通信の制約によって失敗する。
本稿では,各エージェントが制約付きマルコフ決定プロセス(CMDP)を解き,共有制約ベクトルを通じて暗黙的にコーディネートする分散フレームワークを提案する。
例えば、オフロードの特定のケースでは、制約によって共有サーバリソースのオーバーロードが防止される。
調整制約は頻繁に更新され、軽量な調整機構として機能する。
エージェントはグローバルなリソース使用目標に合わせることができるが、直接通信は必要としない。
安全強化学習を用いて、エージェントは、地域とグローバルの両方の目標を満たすポリシーを学ぶ。
理論的な保証を軽微な仮定の下で確立し,提案手法を実験的に検証し,特に大規模環境での集中的および独立的ベースラインよりも優れた性能を示す。
関連論文リスト
- Benchmarking LLMs' Swarm intelligence [50.544186914115045]
大規模言語モデル(LLM)は複雑な推論の可能性を秘めているが、マルチエージェントシステム(MAS)における創発的協調の能力はほとんど探索されていない。
分散エージェントとして機能するLDMのタスクを体系的に評価する新しいベンチマークであるSwarmBenchを紹介する。
本稿では,協調効率の指標を提案し,創発的グループダイナミクスを解析する。
論文 参考訳(メタデータ) (2025-05-07T12:32:01Z) - AgentNet: Decentralized Evolutionary Coordination for LLM-based Multi-Agent Systems [22.291969093748005]
AgentNet(エージェントネット)は、マルチエージェントシステムのための分散化された検索型生成(RAG)ベースのフレームワークである。
静的ロールや集中制御の以前のアプローチとは異なり、AgentNetはエージェントがローカルの専門知識とコンテキストに基づいて接続とタスクのルーティングを調整することができる。
実験の結果,AgentNetは単一エージェントと集中型マルチエージェントのベースラインよりも高いタスク精度を実現することがわかった。
論文 参考訳(メタデータ) (2025-04-01T09:45:25Z) - DePAint: A Decentralized Safe Multi-Agent Reinforcement Learning Algorithm considering Peak and Average Constraints [1.1549572298362787]
本稿では,この問題を解決するために,モーメントに基づく分散勾配法DePaintを提案する。
これは、ピーク制約と平均制約の両方を考慮した、プライバシ保存で完全に分散化されたマルチエージェント強化学習アルゴリズムとしては初めてのものである。
論文 参考訳(メタデータ) (2023-10-22T16:36:03Z) - Distributed Online Rollout for Multivehicle Routing in Unmapped
Environments [0.8437187555622164]
我々は、よく知られた多車両ルーティング問題に対して、完全に分散し、オンラインでスケーラブルな強化学習アルゴリズムを提案する。
エージェントはローカルクラスタに自己組織化し、各クラスタにローカルにマルチエージェントロールアウトスキームを独立に適用する。
提案アルゴリズムは, 放射半径の2倍と3倍の精度で, 基本方針よりも約2倍のコスト向上を実現している。
論文 参考訳(メタデータ) (2023-05-24T22:06:44Z) - Distributed Adaptive Learning Under Communication Constraints [54.22472738551687]
本研究では,コミュニケーション制約下での運用を目的とした適応型分散学習戦略について検討する。
我々は,ストリーミングデータの連続的な観察から,オンライン最適化問題を解決しなければならないエージェントのネットワークを考える。
論文 参考訳(メタデータ) (2021-12-03T19:23:48Z) - Scalable Multi-Agent Reinforcement Learning for Residential Load Scheduling under Data Governance [5.37556626581816]
マルチエージェント強化学習 (MARL) は, 協調型住宅負荷スケジューリング問題において, 顕著な進歩を遂げている。
MARLの最も一般的なパラダイムである集中型トレーニングは、通信制約のあるクラウドエッジ環境における大規模デプロイメントを制限する。
提案手法は,家庭の局所的な観察のみに基づく個人評論家の学習機能である,アクタ批判的手法に基づく。
論文 参考訳(メタデータ) (2021-10-06T14:05:26Z) - Competing Adaptive Networks [56.56653763124104]
適応エージェントのチーム間での分散競争のためのアルゴリズムを開発する。
本稿では,生成的対向ニューラルネットワークの分散学習への応用について述べる。
論文 参考訳(メタデータ) (2021-03-29T14:42:15Z) - F2A2: Flexible Fully-decentralized Approximate Actor-critic for
Cooperative Multi-agent Reinforcement Learning [110.35516334788687]
分散マルチエージェント強化学習アルゴリズムは複雑なアプリケーションでは実践的でないことがある。
本稿では,大規模で汎用的なマルチエージェント設定を扱える,柔軟な完全分散型アクター批判型MARLフレームワークを提案する。
当社のフレームワークは,大規模環境におけるスケーラビリティと安定性を実現し,情報伝達を低減できる。
論文 参考訳(メタデータ) (2020-04-17T14:56:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。