論文の概要: Multi-Agent Distributed Reinforcement Learning for Making Decentralized
Offloading Decisions
- arxiv url: http://arxiv.org/abs/2204.02267v1
- Date: Tue, 5 Apr 2022 15:01:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-06 15:00:14.812093
- Title: Multi-Agent Distributed Reinforcement Learning for Making Decentralized
Offloading Decisions
- Title(参考訳): 分散オフロード決定のためのマルチエージェント分散強化学習
- Authors: Jing Tan and Ramin Khalili and Holger Karl and Artur Hecker
- Abstract要約: 自律エージェントによる分散意思決定問題として計算オフロードを定式化する。
我々は、競争と協力のバランスをとることで、エージェントにプライベートとシステム目標の整合を動機付けるインタラクションメカニズムを設計する。
動的環境下では,部分的,遅延的,ノイズの多い状態情報を用いて学習する新しいマルチエージェントオンライン学習アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 7.326507804995567
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We formulate computation offloading as a decentralized decision-making
problem with autonomous agents. We design an interaction mechanism that
incentivizes agents to align private and system goals by balancing between
competition and cooperation. The mechanism provably has Nash equilibria with
optimal resource allocation in the static case. For a dynamic environment, we
propose a novel multi-agent online learning algorithm that learns with partial,
delayed and noisy state information, and a reward signal that reduces
information need to a great extent. Empirical results confirm that through
learning, agents significantly improve both system and individual performance,
e.g., 40% offloading failure rate reduction, 32% communication overhead
reduction, up to 38% computation resource savings in low contention, 18%
utilization increase with reduced load variation in high contention, and
improvement in fairness. Results also confirm the algorithm's good convergence
and generalization property in significantly different environments.
- Abstract(参考訳): 自律エージェントによる分散意思決定問題として計算オフロードを定式化する。
我々は、競争と協力のバランスをとることで、エージェントにプライベートとシステム目標の整合を動機付けるインタラクションメカニズムを設計する。
この機構は、静的な場合において最適な資源割り当てを伴うナッシュ平衡を持つ。
動的環境下では,部分的,遅延的,ノイズの多い状態情報を用いて学習する新しいマルチエージェントオンライン学習アルゴリズムと,情報の必要量を大幅に削減する報奨信号を提案する。
例えば、40%のオフロード障害率の削減、32%の通信オーバヘッドの削減、38%の計算リソースの低競合化、8%の利用増加、高競合化による負荷変動の低減、公平性の向上などである。
結果は、異なる環境下でのアルゴリズムの優れた収束性と一般化性も確認する。
関連論文リスト
- Boosting the Performance of Decentralized Federated Learning via Catalyst Acceleration [66.43954501171292]
本稿では,Catalytics Accelerationを導入し,DFedCataと呼ばれる促進型分散フェデレート学習アルゴリズムを提案する。
DFedCataは、パラメータの不整合に対処するMoreauエンベロープ関数と、アグリゲーションフェーズを加速するNesterovの外挿ステップの2つの主要コンポーネントで構成されている。
実験により, CIFAR10/100における収束速度と一般化性能の両面において, 提案アルゴリズムの利点を実証した。
論文 参考訳(メタデータ) (2024-10-09T06:17:16Z) - HERL: Tiered Federated Learning with Adaptive Homomorphic Encryption using Reinforcement Learning [12.628921853388862]
HERLは強化学習に基づくアプローチで、Q-Learningを使って動的に暗号化パラメータを最適化する。
提案手法は,選択したクラスタリングアプローチに従って,クライアントのファーストプロファイリングと階層化を行う。
その結果,HERLは実用性17%向上し,収束時間を最大24%削減し,効率を最大30%向上し,セキュリティ損失を最小限に抑えることができた。
論文 参考訳(メタデータ) (2024-09-11T21:26:23Z) - Multi-agent Assessment with QoS Enhancement for HD Map Updates in a Vehicular Network [8.853779271331508]
Reinforcement Learning (RL)アルゴリズムは、車載アドホックネットワーク(VANET)のオフロードプロセスにおける課題に対処するために使用されている。
DQN(Deep Q-learning)とAV(Actor-critic at the autonomous vehicle)は、計算負荷の増加を招き、計算装置に大きな負担とコストを発生させる可能性がある。
本稿では,分散マルチエージェント環境におけるQラーニング単一エージェントソリューションを利用したアプリケーションのスケーラビリティを評価する。
論文 参考訳(メタデータ) (2024-07-31T09:17:09Z) - Asynchronous Federated Learning with Incentive Mechanism Based on
Contract Theory [5.502596101979607]
本稿では,契約理論に基づくインセンティブ機構を統合した新しい非同期FLフレームワークを提案する。
攻撃対象のローカルSGDよりも精度が1.35%向上した。
論文 参考訳(メタデータ) (2023-10-10T09:17:17Z) - Compressed Regression over Adaptive Networks [58.79251288443156]
分散エージェントのネットワークによって達成可能な性能を導出し,通信制約や回帰問題を解消し,適応的に解決する。
エージェントによって最適化に必要なパラメータをオンラインで学習できる最適化アロケーション戦略を考案する。
論文 参考訳(メタデータ) (2023-04-07T13:41:08Z) - Multi-Agent Reinforcement Learning for Long-Term Network Resource
Allocation through Auction: a V2X Application [7.326507804995567]
我々は,自律エージェント間の分散意思決定として,移動エージェントの動的グループ(自動車など)からの計算タスクのオフロードを定式化する。
我々は、競争と協力のバランスをとることで、そのようなエージェントにプライベートとシステム目標の整合を動機付けるインタラクションメカニズムを設計する。
本稿では,部分的,遅延,ノイズの多い状態情報を用いて学習する,新しいマルチエージェントオンライン学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-07-29T10:29:06Z) - Inducing Equilibria via Incentives: Simultaneous Design-and-Play Finds
Global Optima [114.31577038081026]
本稿では,デザイナーとエージェントの問題を同時に1ループで解くための効率的な手法を提案する。
設計者は平衡問題を何度も解決しないが、エージェントに対するインセンティブの全体的な影響を予測できる。
このアルゴリズムは,幅広い種類のゲームに対して,サブ線形速度で大域的最適値に収束することを示す。
論文 参考訳(メタデータ) (2021-10-04T06:53:59Z) - Federated Learning with Unreliable Clients: Performance Analysis and
Mechanism Design [76.29738151117583]
Federated Learning(FL)は、分散クライアント間で効果的な機械学習モデルをトレーニングするための有望なツールとなっている。
しかし、低品質のモデルは信頼性の低いクライアントによってアグリゲータサーバにアップロードすることができ、劣化やトレーニングの崩壊につながる。
クライアントの信頼できない振る舞いをモデル化し、このようなセキュリティリスクを軽減するための防御メカニズムを提案する。
論文 参考訳(メタデータ) (2021-05-10T08:02:27Z) - Optimizing Mixed Autonomy Traffic Flow With Decentralized Autonomous
Vehicles and Multi-Agent RL [63.52264764099532]
本研究では、完全分散制御方式を用いて、混合自律環境でのボトルネックのスループットを向上させる自動運転車の能力について検討する。
この問題にマルチエージェント強化アルゴリズムを適用し、5%の浸透速度で20%から40%の浸透速度で33%までのボトルネックスループットの大幅な改善が達成できることを実証した。
論文 参考訳(メタデータ) (2020-10-30T22:06:05Z) - Value Variance Minimization for Learning Approximate Equilibrium in
Aggregation Systems [8.140037969280716]
集約システムにおける近似平衡解(ウィンウィン)の学習問題を考察する。
本稿では,集約システムにおける近似平衡解(ウィンウィン)の学習の問題について考察する。
論文 参考訳(メタデータ) (2020-03-16T10:02:42Z) - Dynamic Federated Learning [57.14673504239551]
フェデレートラーニング(Federated Learning)は、マルチエージェント環境における集中的なコーディネーション戦略の包括的用語として登場した。
我々は、各イテレーションにおいて、利用可能なエージェントのランダムなサブセットがそのデータに基づいてローカル更新を実行する、フェデレートされた学習モデルを考える。
集約最適化問題に対する真の最小化器上の非定常ランダムウォークモデルの下で、アーキテクチャの性能は、各エージェントにおけるデータ変動率、各エージェントにおけるモデル変動率、アルゴリズムの学習率に逆比例する追跡項の3つの要因によって決定されることを示す。
論文 参考訳(メタデータ) (2020-02-20T15:00:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。