論文の概要: Graph Reinforcement Learning for Predictive Power Allocation to Mobile
Users
- arxiv url: http://arxiv.org/abs/2203.03906v1
- Date: Tue, 8 Mar 2022 08:02:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-09 23:35:38.390738
- Title: Graph Reinforcement Learning for Predictive Power Allocation to Mobile
Users
- Title(参考訳): モバイルユーザ向け予測パワーアロケーションのためのグラフ強化学習
- Authors: Jianyu Zhao and Chenyang Yang
- Abstract要約: 我々は、最適な政策を見つけ、平均チャネルゲインを予測するために、Deep Deterministic Policy gradient (DDPG) を用いる。
トレーニング効率を向上させるために,2種類のリレーショナル前駆体を生かしたグラフDDPGを利用する。
学習した予測ポリシが,完全な将来情報を備えた最適解に近く動作することを示す。
- 参考スコア(独自算出の注目度): 26.991320163807654
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Allocating resources with future channels can save resource to ensure
quality-of-service of video streaming. In this paper, we optimize predictive
power allocation to minimize the energy consumed at distributed units (DUs) by
using deep deterministic policy gradient (DDPG) to find optimal policy and
predict average channel gains. To improve training efficiency, we resort to
graph DDPG for exploiting two kinds of relational priors: (a) permutation
equivariant (PE) and permutation invariant (PI) properties of policy function
and action-value function, (b) topology relation among users and DUs. To design
graph DDPG framework more systematically in harnessing the priors, we first
demonstrate how to transform matrix-based DDPG into graph-based DDPG. Then, we
respectively design the actor and critic networks to satisfy the permutation
properties when graph neural networks are used in embedding and end to-end
manners. To avoid destroying the PE/PI properties of the actor and critic
networks, we conceive a batch normalization method. Finally, we show the impact
of leveraging each prior. Simulation results show that the learned predictive
policy performs close to the optimal solution with perfect future information,
and the graph DDPG algorithms converge much faster than existing DDPG
algorithms.
- Abstract(参考訳): 将来的なチャネルにリソースを割り当てることで、ビデオストリーミングの品質を保証するリソースを節約できる。
本稿では,分散単位 (DU) で消費されるエネルギーを,DDPG (Deep Deterministic Policy gradient) を用いて予測電力割り当てを最適化し,最適ポリシと平均チャネルゲインの予測を行う。
トレーニング効率を向上させるために,2種類のリレーショナル先行手法を生かしたグラフDDPGを利用する。
(a)置換同変(PE)と置換不変(PI)の政策関数と作用値関数の性質
(b)ユーザとdus間のトポロジ関係。
グラフDDPGフレームワークをより体系的に設計するために,まず,行列ベースのDDPGをグラフベースのDDPGに変換する方法を示す。
そこで我々は,グラフニューラルネットワークを組込みとエンド・ツー・エンドの手法で使用する場合,アクタネットワークと批評家ネットワークをそれぞれ設計する。
本研究では,アクタと批評家ネットワークのPE/PI特性の破壊を避けるため,バッチ正規化法を提案する。
最後に,各プリミティブを活用することの影響を示す。
シミュレーションの結果、学習した予測ポリシは、完全な将来情報を持つ最適解に近い性能を示し、グラフDDPGアルゴリズムは既存のDDPGアルゴリズムよりもはるかに高速に収束することがわかった。
関連論文リスト
- Two-Timescale Model Caching and Resource Allocation for Edge-Enabled AI-Generated Content Services [55.0337199834612]
Generative AI(GenAI)は、カスタマイズされたパーソナライズされたAI生成コンテンツ(AIGC)サービスを可能にするトランスフォーメーション技術として登場した。
これらのサービスは数十億のパラメータを持つGenAIモデルの実行を必要とし、リソース制限の無線エッジに重大な障害を生じさせる。
我々は、AIGC品質とレイテンシメトリクスのトレードオフをバランスさせるために、AIGCサービスのジョイントモデルキャッシングとリソースアロケーションの定式化を導入する。
論文 参考訳(メタデータ) (2024-11-03T07:01:13Z) - FusionLLM: A Decentralized LLM Training System on Geo-distributed GPUs with Adaptive Compression [55.992528247880685]
分散トレーニングは、システム設計と効率に関する重要な課題に直面します。
大規模深層ニューラルネットワーク(DNN)のトレーニング用に設計・実装された分散トレーニングシステムFusionLLMを提案する。
本システムと手法は,収束性を確保しつつ,ベースライン法と比較して1.45~9.39倍の高速化を実現可能であることを示す。
論文 参考訳(メタデータ) (2024-10-16T16:13:19Z) - Federated Reinforcement Learning for Resource Allocation in V2X Networks [46.6256432514037]
資源配分はV2Xネットワークの性能に大きな影響を及ぼす。
リソース割り当てのための既存のアルゴリズムのほとんどは、最適化や機械学習に基づいている。
本稿では,連合型強化学習の枠組みの下で,V2Xネットワークにおける資源配分について検討する。
論文 参考訳(メタデータ) (2023-10-15T15:26:54Z) - Graph Signal Restoration Using Nested Deep Algorithm Unrolling [85.53158261016331]
グラフ信号処理は、センサー、社会交通脳ネットワーク、ポイントクラウド処理、グラフネットワークなど、多くのアプリケーションにおいてユビキタスなタスクである。
凸非依存型深部ADMM(ADMM)に基づく2つの復元手法を提案する。
提案手法のパラメータはエンドツーエンドでトレーニング可能である。
論文 参考訳(メタデータ) (2021-06-30T08:57:01Z) - A Heuristically Assisted Deep Reinforcement Learning Approach for
Network Slice Placement [0.7885276250519428]
本稿では,Deep Reinforcement Learning(DRL)に基づくハイブリッド配置ソリューションと,Power of Two Choices原則に基づく専用最適化を提案する。
提案したHuristically-Assisted DRL (HA-DRL) は,他の最先端手法と比較して学習プロセスの高速化と資源利用の促進を可能にする。
論文 参考訳(メタデータ) (2021-05-14T10:04:17Z) - Joint User Association and Power Allocation in Heterogeneous Ultra Dense
Network via Semi-Supervised Representation Learning [22.725452912879376]
HUDN(Heterogeneous Ultra-Dense Network)は、高接続密度と超高データレートを実現する。
本稿では,統合ユーザアソシエーションと電力制御問題を解決するための新しいアイデアを提案する。
グラフニューラルネットワーク(GNN)を訓練し、半教師付き学習を用いてこの表現関数にアプローチします。
論文 参考訳(メタデータ) (2021-03-29T06:39:51Z) - Deep Reinforcement Learning for Resource Constrained Multiclass
Scheduling in Wireless Networks [0.0]
セットアップでは、ランダムに到着するサービス要求に対応するために、利用可能な限られた帯域幅のリソースを割り当てます。
本稿では,Deep Setsと組み合わせた分布型Deep Deterministic Policy Gradient (DDPG)アルゴリズムを提案する。
提案アルゴリズムは, 合成データと実データの両方で検証し, 従来手法に対する一貫した利得を示す。
論文 参考訳(メタデータ) (2020-11-27T09:49:38Z) - Resource Allocation via Model-Free Deep Learning in Free Space Optical
Communications [119.81868223344173]
本稿では,自由空間光学(FSO)通信におけるチャネルフェージング効果の緩和のための資源配分の一般的な問題について検討する。
本フレームワークでは,FSO資源割り当て問題を解決する2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-27T17:38:51Z) - Communication-Efficient Distributed Stochastic AUC Maximization with
Deep Neural Networks [50.42141893913188]
本稿では,ニューラルネットワークを用いた大規模AUCのための分散変数について検討する。
我々のモデルは通信ラウンドをはるかに少なくし、理論上はまだ多くの通信ラウンドを必要としています。
いくつかのデータセットに対する実験は、我々の理論の有効性を示し、我々の理論を裏付けるものである。
論文 参考訳(メタデータ) (2020-05-05T18:08:23Z) - Graph Ordering: Towards the Optimal by Learning [69.72656588714155]
グラフ表現学習は、ノード分類、予測、コミュニティ検出など、多くのグラフベースのアプリケーションで顕著な成功を収めている。
しかし,グラフ圧縮やエッジ分割などのグラフアプリケーションでは,グラフ表現学習タスクに還元することは極めて困難である。
本稿では,このようなアプリケーションの背後にあるグラフ順序付け問題に対して,新しい学習手法を用いて対処することを提案する。
論文 参考訳(メタデータ) (2020-01-18T09:14:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。