論文の概要: Multi-Agent Deep Reinforcement Learning enabled Computation Resource
Allocation in a Vehicular Cloud Network
- arxiv url: http://arxiv.org/abs/2008.06464v2
- Date: Mon, 17 Aug 2020 14:26:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-30 17:37:05.147809
- Title: Multi-Agent Deep Reinforcement Learning enabled Computation Resource
Allocation in a Vehicular Cloud Network
- Title(参考訳): ニューラルネットワークを用いたマルチエージェント深部強化学習による計算資源配分の実現
- Authors: Shilin Xu, Caili Guo, Rose Qingyang Hu and Yi Qian
- Abstract要約: 本稿では,分散アドホック車載ネットワークにおける中央集権的なインフラサポートのない計算資源配分問題について検討する。
VCNにおける真の中央制御ユニットの欠如というジレンマを克服するため、車両上での割り当てを分散的に完了する。
- 参考スコア(独自算出の注目度): 30.736512922808362
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we investigate the computational resource allocation problem
in a distributed Ad-Hoc vehicular network with no centralized infrastructure
support. To support the ever increasing computational needs in such a vehicular
network, the distributed virtual cloud network (VCN) is formed, based on which
a computational resource sharing scheme through offloading among nearby
vehicles is proposed. In view of the time-varying computational resource in
VCN, the statistical distribution characteristics for computational resource
are analyzed in detail. Thereby, a resource-aware combinatorial optimization
objective mechanism is proposed. To alleviate the non-stationary environment
caused by the typically multi-agent environment in VCN, we adopt a centralized
training and decentralized execution framework. In addition, for the objective
optimization problem, we model it as a Markov game and propose a DRL based
multi-agent deep deterministic reinforcement learning (MADDPG) algorithm to
solve it. Interestingly, to overcome the dilemma of lacking a real central
control unit in VCN, the allocation is actually completed on the vehicles in a
distributed manner. The simulation results are presented to demonstrate our
scheme's effectiveness.
- Abstract(参考訳): 本稿では,分散アドホックな車載ネットワークにおいて,集中型インフラストラクチャを含まない計算資源割当問題について検討する。
このような車載ネットワークにおける計算ニーズの増大を支援するため,周辺車両間のオフロードによる計算資源共有方式を基礎として,分散仮想クラウドネットワーク(VCN)を構築した。
VCNにおける時間変化計算資源の観点から、計算資源の統計分布特性を詳細に分析する。
そこで,資源を考慮した組合せ最適化目標機構を提案する。
典型的にはVCNのマルチエージェント環境による非定常環境を緩和するために,集中的なトレーニングと分散実行フレームワークを採用する。
さらに、目的最適化問題に対して、マルコフゲームとしてモデル化し、DRLに基づくマルチエージェント深層決定性強化学習(MADDPG)アルゴリズムを提案する。
興味深いことに、VCNに真の中央制御ユニットがないというジレンマを克服するために、このアロケーションは分散的に実際に車両上で完了する。
本手法の有効性を示すためにシミュレーション結果を示す。
関連論文リスト
- Multi-Resource Allocation for On-Device Distributed Federated Learning
Systems [79.02994855744848]
本研究は,デバイス上の分散フェデレーション学習(FL)システムにおいて,レイテンシとエネルギー消費の重み付け和を最小化する分散マルチリソース割り当て方式を提案する。
システム内の各モバイルデバイスは、指定された領域内でモデルトレーニングプロセスを実行し、それぞれパラメータの導出とアップロードを行うための計算と通信資源を割り当てる。
論文 参考訳(メタデータ) (2022-11-01T14:16:05Z) - Multi-Agent Reinforcement Learning for Long-Term Network Resource
Allocation through Auction: a V2X Application [7.326507804995567]
我々は,自律エージェント間の分散意思決定として,移動エージェントの動的グループ(自動車など)からの計算タスクのオフロードを定式化する。
我々は、競争と協力のバランスをとることで、そのようなエージェントにプライベートとシステム目標の整合を動機付けるインタラクションメカニズムを設計する。
本稿では,部分的,遅延,ノイズの多い状態情報を用いて学習する,新しいマルチエージェントオンライン学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-07-29T10:29:06Z) - DISTREAL: Distributed Resource-Aware Learning in Heterogeneous Systems [2.1506382989223782]
計算資源の不均一性,制限,時間変化のあるデバイス上でのニューラルネットワーク(NN)の分散トレーニングの問題について検討する。
本稿では,適応型,リソース対応,オンデバイス学習機構であるDISTREALを提案する。
論文 参考訳(メタデータ) (2021-12-16T10:15:31Z) - Adaptive Stochastic ADMM for Decentralized Reinforcement Learning in
Edge Industrial IoT [106.83952081124195]
強化学習 (Reinforcement Learning, RL) は, 意思決定および最適制御プロセスのための有望な解法として広く研究されている。
本稿では,Adaptive ADMM (asI-ADMM)アルゴリズムを提案する。
実験の結果,提案アルゴリズムは通信コストやスケーラビリティの観点から技術状況よりも優れており,複雑なIoT環境に適応できることがわかった。
論文 参考訳(メタデータ) (2021-06-30T16:49:07Z) - A Heuristically Assisted Deep Reinforcement Learning Approach for
Network Slice Placement [0.7885276250519428]
本稿では,Deep Reinforcement Learning(DRL)に基づくハイブリッド配置ソリューションと,Power of Two Choices原則に基づく専用最適化を提案する。
提案したHuristically-Assisted DRL (HA-DRL) は,他の最先端手法と比較して学習プロセスの高速化と資源利用の促進を可能にする。
論文 参考訳(メタデータ) (2021-05-14T10:04:17Z) - Reinforcement Learning for Datacenter Congestion Control [50.225885814524304]
渋滞制御アルゴリズムの成功は、レイテンシとネットワーク全体のスループットを劇的に改善する。
今日まで、このような学習ベースのアルゴリズムはこの領域で実用的な可能性を示さなかった。
実世界のデータセンターネットワークの様々な構成に一般化することを目的としたRLに基づくアルゴリズムを考案する。
本稿では,この手法が他のRL手法よりも優れており,トレーニング中に見られなかったシナリオに一般化可能であることを示す。
論文 参考訳(メタデータ) (2021-02-18T13:49:28Z) - Dynamic RAN Slicing for Service-Oriented Vehicular Networks via
Constrained Learning [40.5603189901241]
品質の異なる車両用インターネット(IoV)サービスにおける無線アクセスネットワーク(RAN)スライシング問題について検討する。
無線スペクトルと演算資源を動的に割り当てる動的RANスライシングフレームワークを提案する。
RAWSは,ベンチマークと比較すると,要求を高い確率で満たしながら,システムコストを効果的に削減できることを示す。
論文 参考訳(メタデータ) (2020-12-03T15:08:38Z) - Resource Allocation via Model-Free Deep Learning in Free Space Optical
Communications [119.81868223344173]
本稿では,自由空間光学(FSO)通信におけるチャネルフェージング効果の緩和のための資源配分の一般的な問題について検討する。
本フレームワークでは,FSO資源割り当て問題を解決する2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-27T17:38:51Z) - Multi-agent Reinforcement Learning for Resource Allocation in IoT
networks with Edge Computing [16.129649374251088]
エンドユーザーが計算をオフロードするのは、スペクトルとリソースに対する大きな要求のためである。
本稿では,IoTエッジコンピューティングネットワークにおけるリソース割り当てを伴うオフロード機構をゲームとして定式化することによって検討する。
論文 参考訳(メタデータ) (2020-04-05T20:59:20Z) - Decentralized MCTS via Learned Teammate Models [89.24858306636816]
本稿では,モンテカルロ木探索に基づくトレーニング可能なオンライン分散計画アルゴリズムを提案する。
深層学習と畳み込みニューラルネットワークを用いて正確なポリシー近似を作成可能であることを示す。
論文 参考訳(メタデータ) (2020-03-19T13:10:20Z) - Reinforcement Learning Based Vehicle-cell Association Algorithm for
Highly Mobile Millimeter Wave Communication [53.47785498477648]
本稿では,ミリ波通信網における車とセルの関連性について検討する。
まず、ユーザ状態(VU)問題を離散的な非車両関連最適化問題として定式化する。
提案手法は,複数のベースライン設計と比較して,ユーザの複雑性とVUEの20%削減の合計で最大15%のゲインが得られる。
論文 参考訳(メタデータ) (2020-01-22T08:51:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。