論文の概要: Graph Reinforcement Learning for Radio Resource Allocation
- arxiv url: http://arxiv.org/abs/2203.03906v2
- Date: Sat, 23 Sep 2023 14:23:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-27 05:14:15.408811
- Title: Graph Reinforcement Learning for Radio Resource Allocation
- Title(参考訳): 無線リソース割り当てのためのグラフ強化学習
- Authors: Jianyu Zhao and Chenyang Yang
- Abstract要約: 我々は,無線通信における多くの問題に固有の2種類のリレーショナル先行性を活用するために,グラフ強化学習を利用する。
グラフ強化学習フレームワークを体系的に設計するために,まず状態行列を状態グラフに変換する方法を提案する。
次に,所望の置換特性を満たすグラフニューラルネットワークの汎用手法を提案する。
- 参考スコア(独自算出の注目度): 13.290246410488727
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep reinforcement learning (DRL) for resource allocation has been
investigated extensively owing to its ability of handling model-free and
end-to-end problems. Yet the high training complexity of DRL hinders its
practical use in dynamic wireless systems. To reduce the training cost, we
resort to graph reinforcement learning for exploiting two kinds of relational
priors inherent in many problems in wireless communications: topology
information and permutation properties. To design graph reinforcement learning
framework systematically for harnessing the two priors, we first conceive a
method to transform state matrix into state graph, and then propose a general
method for graph neural networks to satisfy desirable permutation properties.
To demonstrate how to apply the proposed methods, we take deep deterministic
policy gradient (DDPG) as an example for optimizing two representative resource
allocation problems. One is predictive power allocation that minimizes the
energy consumed for ensuring the quality-ofservice of each user that requests
video streaming. The other is link scheduling that maximizes the sum-rate for
device-to-device communications. Simulation results show that the graph DDPG
algorithm converges much faster and needs much lower space complexity than
existing DDPG algorithms to achieve the same learning performance.
- Abstract(参考訳): 資源配分のための深層強化学習 (DRL) は, モデルフリーとエンドツーエンドの問題に対処できるため, 広く研究されている。
しかし、DRLの高度トレーニングの複雑さは、ダイナミック無線システムにおける実用性を妨げている。
トレーニングコストを削減すべく,無線通信における多くの問題に固有の2種類の関係性,つまりトポロジ情報と置換特性を利用するグラフ強化学習を利用する。
グラフ強化学習フレームワークを体系的に設計することにより,まず状態行列を状態グラフに変換する手法を考え,その後,所望の置換特性を満たすグラフニューラルネットワークの一般的な手法を提案する。
提案手法の適用方法を示すために,2つの代表的な資源配分問題を最適化する例として,Deep Deterministic Policy gradient (DDPG) を用いる。
1つは、ビデオストリーミングを要求する各ユーザのサービス品質を保証するために消費されるエネルギーを最小化する予測電力割り当てである。
もう1つは、デバイス間通信の総和レートを最大化するリンクスケジューリングである。
シミュレーションの結果,グラフDDPGアルゴリズムは既存のDDPGアルゴリズムよりもはるかに高速に収束し,同じ学習性能を実現するためには,空間の複雑さがはるかに低いことがわかった。
関連論文リスト
- GDSG: Graph Diffusion-based Solution Generator for Optimization Problems in MEC Networks [109.17835015018532]
グラフ拡散型ソリューション生成(GDSG)法を提案する。
このアプローチは、おそらく最適な解に収束しながら、最適以下のデータセットを扱うように設計されている。
グラフニューラルネットワーク(GNN)を用いたマルチタスク拡散モデルとしてGDSGを構築し,高品質な解の分布を求める。
論文 参考訳(メタデータ) (2024-12-11T11:13:43Z) - Two-Timescale Model Caching and Resource Allocation for Edge-Enabled AI-Generated Content Services [55.0337199834612]
Generative AI(GenAI)は、カスタマイズされたパーソナライズされたAI生成コンテンツ(AIGC)サービスを可能にするトランスフォーメーション技術として登場した。
これらのサービスは数十億のパラメータを持つGenAIモデルの実行を必要とし、リソース制限の無線エッジに重大な障害を生じさせる。
我々は、AIGC品質とレイテンシメトリクスのトレードオフをバランスさせるために、AIGCサービスのジョイントモデルキャッシングとリソースアロケーションの定式化を導入する。
論文 参考訳(メタデータ) (2024-11-03T07:01:13Z) - Federated Reinforcement Learning for Resource Allocation in V2X Networks [46.6256432514037]
資源配分はV2Xネットワークの性能に大きな影響を及ぼす。
リソース割り当てのための既存のアルゴリズムのほとんどは、最適化や機械学習に基づいている。
本稿では,連合型強化学習の枠組みの下で,V2Xネットワークにおける資源配分について検討する。
論文 参考訳(メタデータ) (2023-10-15T15:26:54Z) - Graph Signal Restoration Using Nested Deep Algorithm Unrolling [85.53158261016331]
グラフ信号処理は、センサー、社会交通脳ネットワーク、ポイントクラウド処理、グラフネットワークなど、多くのアプリケーションにおいてユビキタスなタスクである。
凸非依存型深部ADMM(ADMM)に基づく2つの復元手法を提案する。
提案手法のパラメータはエンドツーエンドでトレーニング可能である。
論文 参考訳(メタデータ) (2021-06-30T08:57:01Z) - A Heuristically Assisted Deep Reinforcement Learning Approach for
Network Slice Placement [0.7885276250519428]
本稿では,Deep Reinforcement Learning(DRL)に基づくハイブリッド配置ソリューションと,Power of Two Choices原則に基づく専用最適化を提案する。
提案したHuristically-Assisted DRL (HA-DRL) は,他の最先端手法と比較して学習プロセスの高速化と資源利用の促進を可能にする。
論文 参考訳(メタデータ) (2021-05-14T10:04:17Z) - Joint User Association and Power Allocation in Heterogeneous Ultra Dense
Network via Semi-Supervised Representation Learning [22.725452912879376]
HUDN(Heterogeneous Ultra-Dense Network)は、高接続密度と超高データレートを実現する。
本稿では,統合ユーザアソシエーションと電力制御問題を解決するための新しいアイデアを提案する。
グラフニューラルネットワーク(GNN)を訓練し、半教師付き学習を用いてこの表現関数にアプローチします。
論文 参考訳(メタデータ) (2021-03-29T06:39:51Z) - Deep Reinforcement Learning for Resource Constrained Multiclass
Scheduling in Wireless Networks [0.0]
セットアップでは、ランダムに到着するサービス要求に対応するために、利用可能な限られた帯域幅のリソースを割り当てます。
本稿では,Deep Setsと組み合わせた分布型Deep Deterministic Policy Gradient (DDPG)アルゴリズムを提案する。
提案アルゴリズムは, 合成データと実データの両方で検証し, 従来手法に対する一貫した利得を示す。
論文 参考訳(メタデータ) (2020-11-27T09:49:38Z) - Resource Allocation via Model-Free Deep Learning in Free Space Optical
Communications [119.81868223344173]
本稿では,自由空間光学(FSO)通信におけるチャネルフェージング効果の緩和のための資源配分の一般的な問題について検討する。
本フレームワークでは,FSO資源割り当て問題を解決する2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-27T17:38:51Z) - Communication-Efficient Distributed Stochastic AUC Maximization with
Deep Neural Networks [50.42141893913188]
本稿では,ニューラルネットワークを用いた大規模AUCのための分散変数について検討する。
我々のモデルは通信ラウンドをはるかに少なくし、理論上はまだ多くの通信ラウンドを必要としています。
いくつかのデータセットに対する実験は、我々の理論の有効性を示し、我々の理論を裏付けるものである。
論文 参考訳(メタデータ) (2020-05-05T18:08:23Z) - Graph Ordering: Towards the Optimal by Learning [69.72656588714155]
グラフ表現学習は、ノード分類、予測、コミュニティ検出など、多くのグラフベースのアプリケーションで顕著な成功を収めている。
しかし,グラフ圧縮やエッジ分割などのグラフアプリケーションでは,グラフ表現学習タスクに還元することは極めて困難である。
本稿では,このようなアプリケーションの背後にあるグラフ順序付け問題に対して,新しい学習手法を用いて対処することを提案する。
論文 参考訳(メタデータ) (2020-01-18T09:14:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。