論文の概要: Multi-agent Reinforcement Learning for Resource Allocation in IoT
networks with Edge Computing
- arxiv url: http://arxiv.org/abs/2004.02315v1
- Date: Sun, 5 Apr 2020 20:59:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 13:19:57.937918
- Title: Multi-agent Reinforcement Learning for Resource Allocation in IoT
networks with Edge Computing
- Title(参考訳): エッジコンピューティングを用いたIoTネットワークにおけるリソース割り当てのためのマルチエージェント強化学習
- Authors: Xiaolan Liu, Jiadong Yu, Yue Gao
- Abstract要約: エンドユーザーが計算をオフロードするのは、スペクトルとリソースに対する大きな要求のためである。
本稿では,IoTエッジコンピューティングネットワークにおけるリソース割り当てを伴うオフロード機構をゲームとして定式化することによって検討する。
- 参考スコア(独自算出の注目度): 16.129649374251088
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To support popular Internet of Things (IoT) applications such as virtual
reality, mobile games and wearable devices, edge computing provides a front-end
distributed computing archetype of centralized cloud computing with low
latency. However, it's challenging for end users to offload computation due to
their massive requirements on spectrum and computation resources and frequent
requests on Radio Access Technology (RAT). In this paper, we investigate
computation offloading mechanism with resource allocation in IoT edge computing
networks by formulating it as a stochastic game. Here, each end user is a
learning agent observing its local environment to learn optimal decisions on
either local computing or edge computing with the goal of minimizing long term
system cost by choosing its transmit power level, RAT and sub-channel without
knowing any information of the other end users. Therefore, a multi-agent
reinforcement learning framework is developed to solve the stochastic game with
a proposed independent learners based multi-agent Q-learning (IL-based MA-Q)
algorithm. Simulations demonstrate that the proposed IL-based MA-Q algorithm is
feasible to solve the formulated problem and is more energy efficient without
extra cost on channel estimation at the centralized gateway compared to the
other two benchmark algorithms.
- Abstract(参考訳): 仮想現実、モバイルゲーム、ウェアラブルデバイスといった一般的なIoT(Internet of Things)アプリケーションをサポートするために、エッジコンピューティングは、低レイテンシで集中型クラウドコンピューティングのフロントエンド分散コンピューティングアーティタイプを提供する。
しかし、スペクトルや計算リソースやRadio Access Technology(RAT)の頻繁な要求に対する大きな要求のために、エンドユーザが計算をオフロードすることは難しい。
本稿では,iotエッジコンピューティングネットワークにおけるリソース割り当てを伴う計算オフロード機構について,確率ゲームとして定式化することにより検討する。
ここでは、各エンドユーザは、そのローカル環境を観察してローカルコンピューティングまたはエッジコンピューティングのいずれかの最適決定を学習し、送信電力レベル、RAT、サブチャネルを選択することで、他のエンドユーザの情報を知らずに、長期システムコストを最小化する。
そこで,多エージェント強化学習フレームワークを開発し,独立学習者に基づく多エージェントq-learning (il-based ma-q) アルゴリズムを提案する。
シミュレーションにより,提案したILベースのMA-Qアルゴリズムは定式化問題を解くことが可能であり,他の2つのベンチマークアルゴリズムと比較して,集中ゲートウェイでのチャネル推定に余分なコストを要さずにエネルギー効率がよいことを示した。
関連論文リスト
- To Train or Not to Train: Balancing Efficiency and Training Cost in Deep Reinforcement Learning for Mobile Edge Computing [15.079887992932692]
資源を割り当てるDeep Reinforcement Learning (DRL)エージェントをいつトレーニングするかを動的に選択するアルゴリズムを提案する。
トレーニングのオーバーヘッドを伴うシナリオに対して直接適用することができるので,本手法は極めて一般的である。
論文 参考訳(メタデータ) (2024-11-11T16:02:12Z) - Hypergame Theory for Decentralized Resource Allocation in Multi-user Semantic Communications [60.63472821600567]
マルチユーザSCシステムにおける分散コンピューティングと通信資源割り当てのための新しいフレームワークを提案する。
通信資源と計算資源を効率的に割り当てることの課題は、Stackelbergハイパーゲーム理論の適用によって解決される。
シミュレーションの結果,提案したStackelbergハイパーゲームは通信資源と計算資源を効率的に利用することができることがわかった。
論文 参考訳(メタデータ) (2024-09-26T15:55:59Z) - Online Learning for Orchestration of Inference in Multi-User
End-Edge-Cloud Networks [3.6076391721440633]
ディープラーニングのためのコラボレーション型のエッジクラウドコンピューティングは、さまざまなパフォーマンスと効率を提供する。
本稿では、最適オフロードポリシーを学習する強化学習に基づく計算オフロードソリューションを提案する。
我々のソリューションは、平均応答時間において、0.9%未満の精度で、最先端技術と比較して35%のスピードアップを提供する。
論文 参考訳(メタデータ) (2022-02-21T21:41:29Z) - Computational Intelligence and Deep Learning for Next-Generation
Edge-Enabled Industrial IoT [51.68933585002123]
エッジ対応産業用IoTネットワークにおける計算知能とディープラーニング(DL)の展開方法について検討する。
本稿では,新しいマルチエグジットベースフェデレーションエッジ学習(ME-FEEL)フレームワークを提案する。
特に、提案されたME-FEELは、非常に限られたリソースを持つ産業用IoTネットワークにおいて、最大32.7%の精度を達成することができる。
論文 参考訳(メタデータ) (2021-10-28T08:14:57Z) - Reconfigurable Intelligent Surface Assisted Mobile Edge Computing with
Heterogeneous Learning Tasks [53.1636151439562]
モバイルエッジコンピューティング(MEC)は、AIアプリケーションに自然なプラットフォームを提供します。
再構成可能なインテリジェントサーフェス(RIS)の助けを借りて、MECで機械学習タスクを実行するインフラストラクチャを提示します。
具体的には,モバイルユーザの送信パワー,基地局のビームフォーミングベクトル,risの位相シフト行列を共同で最適化することにより,参加ユーザの学習誤差を最小化する。
論文 参考訳(メタデータ) (2020-12-25T07:08:50Z) - Toward Multiple Federated Learning Services Resource Sharing in Mobile
Edge Networks [88.15736037284408]
本稿では,マルチアクセスエッジコンピューティングサーバにおいて,複数のフェデレーション付き学習サービスの新たなモデルについて検討する。
共同資源最適化とハイパーラーニング率制御の問題,すなわちMS-FEDLを提案する。
シミュレーションの結果,提案アルゴリズムの収束性能を実証した。
論文 参考訳(メタデータ) (2020-11-25T01:29:41Z) - Edge Intelligence for Energy-efficient Computation Offloading and
Resource Allocation in 5G Beyond [7.953533529450216]
さらに5Gは、エッジデバイス、エッジサーバ、クラウドの異種機能を活用可能な、エッジクラウドオーケストレーションネットワークである。
マルチユーザ無線ネットワークでは、多様なアプリケーション要件とデバイス間の通信のための様々な無線アクセスモードの可能性により、最適な計算オフロード方式の設計が困難になる。
深層強化学習(Dep Reinforcement Learning, DRL)は、そのような問題に限定的で精度の低いネットワーク情報で対処する新興技術である。
論文 参考訳(メタデータ) (2020-11-17T05:51:03Z) - A Machine Learning Approach for Task and Resource Allocation in Mobile
Edge Computing Based Networks [108.57859531628264]
無線ネットワークにおいて,共同作業,スペクトル,送信電力配分問題について検討する。
提案アルゴリズムは、標準Q-ラーニングアルゴリズムと比較して、収束に必要なイテレーション数と全ユーザの最大遅延を最大18%、11.1%削減することができる。
論文 参考訳(メタデータ) (2020-07-20T13:46:42Z) - Information Freshness-Aware Task Offloading in Air-Ground Integrated
Edge Computing Systems [49.80033982995667]
本稿では,空域統合マルチアクセスエッジコンピューティングシステムにおける情報更新性を考慮したタスクオフロードの問題について検討する。
サードパーティのリアルタイムアプリケーションサービスプロバイダは、InPからの限られた通信と計算リソースで、加入したモバイルユーザ(MU)にコンピューティングサービスを提供する。
本稿では,各MUに2つの個別の深度Q-networksを適用し,Q-factorと後Q-factorを近似する新しい深度強化学習手法を提案する。
論文 参考訳(メタデータ) (2020-07-15T21:32:43Z) - Computation Offloading in Multi-Access Edge Computing Networks: A
Multi-Task Learning Approach [7.203439085947118]
マルチアクセスエッジコンピューティング(MEC)は、いくつかのタスクをMECサーバ(MES)に統合された近接アクセスポイント(AP)にオフロードすることで、モバイル機器が計算集約的なアプリケーションに対応できるようにする可能性をすでに示している。
しかし,MESのネットワーク条件や計算資源が限られているため,モバイル端末によるオフロード決定やMESが割り当てる計算資源は,低コストで効率よく達成できない。
我々はMECネットワークのための動的オフロードフレームワークを提案し、アップリンク非直交多重アクセス(NOMA)を用いて複数のデバイスがアップロードできるようにする。
論文 参考訳(メタデータ) (2020-06-29T15:11:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。