論文の概要: Fully Distributed Fog Load Balancing with Multi-Agent Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2405.12236v1
- Date: Wed, 15 May 2024 23:44:06 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-22 15:26:53.233581
- Title: Fully Distributed Fog Load Balancing with Multi-Agent Reinforcement Learning
- Title(参考訳): マルチエージェント強化学習による完全分散フォグ負荷分散
- Authors: Maad Ebrahim, Abdelhakim Hafid,
- Abstract要約: 本稿では,MARL(Multi-Agent Reinforcement Learning)を用いた完全分散負荷分散ソリューションを提案する。
MARLエージェントは、環境の動的変化に対する生涯の自己適応のためにトランスファーラーニングを使用する。
文献における非現実的な一般的な仮定とは違って,現実的な周波数が環境の状態を観察するために与える影響を解析する。
- 参考スコア(独自算出の注目度): 1.9643748953805935
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Real-time Internet of Things (IoT) applications require real-time support to handle the ever-growing demand for computing resources to process IoT workloads. Fog Computing provides high availability of such resources in a distributed manner. However, these resources must be efficiently managed to distribute unpredictable traffic demands among heterogeneous Fog resources. This paper proposes a fully distributed load-balancing solution with Multi-Agent Reinforcement Learning (MARL) that intelligently distributes IoT workloads to optimize the waiting time while providing fair resource utilization in the Fog network. These agents use transfer learning for life-long self-adaptation to dynamic changes in the environment. By leveraging distributed decision-making, MARL agents effectively minimize the waiting time compared to a single centralized agent solution and other baselines, enhancing end-to-end execution delay. Besides performance gain, a fully distributed solution allows for a global-scale implementation where agents can work independently in small collaboration regions, leveraging nearby local resources. Furthermore, we analyze the impact of a realistic frequency to observe the state of the environment, unlike the unrealistic common assumption in the literature of having observations readily available in real-time for every required action. The findings highlight the trade-off between realism and performance using an interval-based Gossip-based multi-casting protocol against assuming real-time observation availability for every generated workload.
- Abstract(参考訳): リアルタイムモノのインターネット(IoT)アプリケーションは、IoTワークロードを処理するためのコンピューティングリソースの需要の増大に対処するために、リアルタイムのサポートを必要とします。
Fog Computingは、そのようなリソースを分散的に高可用性にします。
しかし、これらのリソースは、予測不可能なトラフィック要求を異種Fogリソースに分散するために、効率的に管理されなければならない。
本稿では,マルチエージェント強化学習(MARL)を用いた完全分散ロードバランシングソリューションを提案する。
これらのエージェントは、環境の動的変化に対する生涯の自己適応のためにトランスファーラーニングを使用する。
分散意思決定を活用することで、MARLエージェントは単一の集中型エージェントソリューションや他のベースラインと比較して待ち時間を効果的に最小化し、エンドツーエンドの実行遅延を増大させる。
パフォーマンス向上に加えて、完全に分散されたソリューションにより、エージェントが小さなコラボレーションリージョンで独立して動作し、近くのローカルリソースを活用するグローバルな実装が可能になる。
さらに,本論文では,必要な行動ごとにリアルタイムに観測できるという文献における非現実的な一般的な仮定とは違って,環境の状態を観察するための現実的な周波数の影響を分析する。
この結果は、間隔ベースのGossipベースのマルチキャストプロトコルを使用して、生成されたワークロード毎のリアルタイム観測可用性を仮定する上で、リアリズムとパフォーマンスのトレードオフを浮き彫りにする。
関連論文リスト
- Communication-Efficient Training Workload Balancing for Decentralized Multi-Agent Learning [20.683081355473664]
分散マルチエージェント学習(DML)は、データのプライバシを保持しながら協調的なモデルトレーニングを可能にする。
ComDMLは分散アプローチを通じてエージェント間のワークロードのバランスをとる。
ComDMLは、最先端の手法と比較して、モデル精度を維持しながら、トレーニング全体の時間を著しく短縮することができる。
論文 参考訳(メタデータ) (2024-05-01T20:03:37Z) - Lifelong Learning for Fog Load Balancing: A Transfer Learning Approach [0.7366405857677226]
待ち時間の最小化により,IoTアプリケーションの実行遅延を最適化するプライバシ対応強化学習(RL)エージェントの性能向上を図る。
本稿では,行動遅延を最小限に抑えるために軽量推論モデルを用いて,環境変化が著しい場合にのみ再訓練を行う,これらのエージェントのための生涯学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-08T14:49:33Z) - Adaptive Resource Allocation for Virtualized Base Stations in O-RAN with
Online Learning [60.17407932691429]
基地局(vBS)を備えたオープンラジオアクセスネットワークシステムは、柔軟性の向上、コスト削減、ベンダーの多様性、相互運用性のメリットを提供する。
本研究では,予期せぬ「混み合う」環境下であっても,効率的なスループットとvBSエネルギー消費のバランスをとるオンライン学習アルゴリズムを提案する。
提案手法は, 課題のある環境においても, 平均最適性ギャップをゼロにすることで, サブ線形後悔を実現する。
論文 参考訳(メタデータ) (2023-09-04T17:30:21Z) - Optimization of Image Transmission in a Cooperative Semantic
Communication Networks [68.2233384648671]
画像伝送のためのセマンティック通信フレームワークを開発した。
サーバは、セマンティックコミュニケーション技術を用いて、画像の集合を協調的にユーザへ送信する。
抽出した意味情報と原画像との相関関係を測定するために,マルチモーダル・メトリックを提案する。
論文 参考訳(メタデータ) (2023-01-01T15:59:13Z) - Learning Distributed and Fair Policies for Network Load Balancing as
Markov Potentia Game [4.892398873024191]
本稿では、複数のロードバランサ(LB)を配置するデータセンター(DC)におけるネットワーク負荷分散問題について検討する。
この問題の課題は、異種処理アーキテクチャと動的環境から成り立っている。
マルチエージェント負荷分散問題をマルコフポテンシャルゲームとして定式化し、そのポテンシャル関数としてのワークロード分布の公平さを慎重に適切に設計する。
ゲームのナッシュ平衡を近似するために,完全分散MARLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-06-03T08:29:02Z) - Locality Matters: A Scalable Value Decomposition Approach for
Cooperative Multi-Agent Reinforcement Learning [52.7873574425376]
協調型マルチエージェント強化学習(MARL)は,エージェント数で指数関数的に大きい状態空間と動作空間により,スケーラビリティの問題に直面する。
本稿では,学習分散実行パラダイムに局所報酬を組み込んだ,新しい価値に基づくマルチエージェントアルゴリズム LOMAQ を提案する。
論文 参考訳(メタデータ) (2021-09-22T10:08:15Z) - Fast-Convergent Dynamics for Distributed Resource Allocation Over Sparse
Time-Varying Networks [8.830479021890577]
本稿では,時間変動マルチエージェントネットワーク上のリソース割り当てを解決するために分散ダイナミクスを配置する。
各エージェントの状態は、そのエージェントで使用される/生成されるリソースの量を表し、リソースの総量は固定される。
これは、モバイルエッジコンピューティング、スマートグリッド上の経済的ディスパッチ、マルチエージェントカバレッジコントロールなどの分散アプリケーションによって動機付けられます。
論文 参考訳(メタデータ) (2020-12-15T09:57:54Z) - Dif-MAML: Decentralized Multi-Agent Meta-Learning [54.39661018886268]
我々は,MAML や Dif-MAML と呼ばれる協調型マルチエージェントメタ学習アルゴリズムを提案する。
提案手法により, エージェントの集合が線形速度で合意に達し, 集約MAMLの定常点に収束できることを示す。
シミュレーションの結果は従来の非協調的な環境と比較して理論的な結果と優れた性能を示している。
論文 参考訳(メタデータ) (2020-10-06T16:51:09Z) - Pollux: Co-adaptive Cluster Scheduling for Goodput-Optimized Deep
Learning [61.29990368322931]
Polluxは、相互依存要因を適応的に最適化することで、ディープラーニング(DL)クラスタのスケジューリング性能を改善する。
Polluxは、最先端のDLスケジューラと比較して、平均的なジョブ完了時間を37-50%削減する。
論文 参考訳(メタデータ) (2020-08-27T16:56:48Z) - Distributed Resource Scheduling for Large-Scale MEC Systems: A
Multi-Agent Ensemble Deep Reinforcement Learning with Imitation Acceleration [44.40722828581203]
本稿では,各MECサーバにデプロイされた各エージェントのグローバル情報と分散意思決定に依存する集中型トレーニングを含む分散インテリジェントリソーススケジューリング(DIRS)フレームワークを提案する。
まず,マルチエージェント・アンサンブルを用いた分散強化学習(DRL)アーキテクチャを導入し,各エージェントの全体的なニューラルネットワーク構造を簡素化する。
第2に,提案したDIRSフレームワークの探索能力を高めるために,新しいL'evyフライトサーチにより,最適に近い状態対が得られた。
論文 参考訳(メタデータ) (2020-05-21T20:04:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。