論文の概要: Power Allocation for Delay Optimization in Device-to-Device Networks: A Graph Reinforcement Learning Approach
- arxiv url: http://arxiv.org/abs/2505.12902v1
- Date: Mon, 19 May 2025 09:37:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:11.517607
- Title: Power Allocation for Delay Optimization in Device-to-Device Networks: A Graph Reinforcement Learning Approach
- Title(参考訳): デバイス間ネットワークにおける遅延最適化のためのパワーアロケーション:グラフ強化学習アプローチ
- Authors: Hao Fang, Kai Huang, Hao Ye, Chongtao Guo, Le Liang, Xiao Li, Shi Jin,
- Abstract要約: 本稿では、デバイス間通信(D2D)におけるニューラルネットワーク(GNN)に基づく強化学習(RL)を利用して、遅延最適化のための新しいパワーパワーアプローチを提案する。
提案手法は,ユーザフェアネスを確保しつつ,平均遅延を効果的に低減し,ベースライン法より優れ,展示や一般化の能力を有する。
- 参考スコア(独自算出の注目度): 32.49886544394408
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The pursuit of rate maximization in wireless communication frequently encounters substantial challenges associated with user fairness. This paper addresses these challenges by exploring a novel power allocation approach for delay optimization, utilizing graph neural networks (GNNs)-based reinforcement learning (RL) in device-to-device (D2D) communication. The proposed approach incorporates not only channel state information but also factors such as packet delay, the number of backlogged packets, and the number of transmitted packets into the components of the state information. We adopt a centralized RL method, where a central controller collects and processes the state information. The central controller functions as an agent trained using the proximal policy optimization (PPO) algorithm. To better utilize topology information in the communication network and enhance the generalization of the proposed method, we embed GNN layers into both the actor and critic networks of the PPO algorithm. This integration allows for efficient parameter updates of GNNs and enables the state information to be parameterized as a low-dimensional embedding, which is leveraged by the agent to optimize power allocation strategies. Simulation results demonstrate that the proposed method effectively reduces average delay while ensuring user fairness, outperforms baseline methods, and exhibits scalability and generalization capability.
- Abstract(参考訳): 無線通信におけるレート最大化の追求は、ユーザフェアネスに関連する重大な課題に頻繁に遭遇する。
本稿では、デバイス間通信(D2D)におけるグラフニューラルネットワーク(GNN)に基づく強化学習(RL)を利用して、遅延最適化のための新たなパワーアロケーション手法を提案する。
提案手法では, チャネル状態情報だけでなく, パケット遅延, バックログパケット数, 送信パケット数などの要因を, 状態情報のコンポーネントに組み込む。
中央制御器が状態情報を収集・処理する集中型RL方式を採用する。
中央制御器は、近似ポリシー最適化(PPO)アルゴリズムを用いて訓練されたエージェントとして機能する。
通信ネットワークにおけるトポロジ情報をより活用し,提案手法の一般化を促進するために,PPOアルゴリズムのアクタネットワークと批評家ネットワークにGNN層を組み込む。
この統合により、GNNの効率的なパラメータ更新が可能になり、状態情報を低次元の埋め込みとしてパラメータ化することができる。
シミュレーションの結果,提案手法はユーザフェアネスを確保しつつ,平均遅延を効果的に低減し,ベースライン法より優れ,スケーラビリティと一般化能力を示すことがわかった。
関連論文リスト
- Opportunistic Routing in Wireless Communications via Learnable State-Augmented Policies [7.512221808783587]
本稿では,大規模無線通信ネットワークにおけるパケットベースの情報ルーティングの課題に対処する。
機会的ルーティングは、無線通信の放送特性を利用して、最適な転送ノードを動的に選択する。
ネットワーク内のソースノードが処理する全情報の最大化を目的とした,状態拡張(SA)に基づく分散最適化手法を提案する。
論文 参考訳(メタデータ) (2025-03-05T18:44:56Z) - Learning State-Augmented Policies for Information Routing in Communication Networks [84.76186111434818]
我々は,グラフニューラルネットワーク(GNN)アーキテクチャを用いて,ソースノードの集約情報を最大化する,新たなステート拡張(SA)戦略を開発した。
教師なし学習手法を利用して、GNNアーキテクチャの出力を最適情報ルーティング戦略に変換する。
実験では,実時間ネットワークトポロジの評価を行い,アルゴリズムの有効性を検証した。
論文 参考訳(メタデータ) (2023-09-30T04:34:25Z) - ENGNN: A General Edge-Update Empowered GNN Architecture for Radio
Resource Management in Wireless Networks [29.23937571816269]
鍵となる課題は、無線リソースをビームフォーミングとパワーアロケーションによって効率的に管理することである。
本稿では,GNNがノード変数とエッジ変数の両方を扱えるように,エッジ更新機構を提案する。
提案手法は平均和率が高いが,最先端の手法よりもはるかに短い時間で計算できる。
論文 参考訳(メタデータ) (2022-12-14T14:04:25Z) - Over-the-Air Federated Learning via Second-Order Optimization [37.594140209854906]
フェデレートラーニング(FL)は、無線ネットワーク上でのタスク指向のデータトラフィックを、限られた無線リソースによって引き起こす可能性がある。
本稿では,通信ラウンドを同時に削減し,低レイテンシなグローバルモデルアグリゲーションを実現するために,空対2次フェデレーション最適化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-03-29T12:39:23Z) - Federated Learning over Wireless IoT Networks with Optimized
Communication and Resources [98.18365881575805]
協調学習技術のパラダイムとしてのフェデレートラーニング(FL)は研究の注目を集めている。
無線システム上での高速応答および高精度FLスキームの検証が重要である。
提案する通信効率のよいフェデレーション学習フレームワークは,強い線形速度で収束することを示す。
論文 参考訳(メタデータ) (2021-10-22T13:25:57Z) - Fast Power Control Adaptation via Meta-Learning for Random Edge Graph
Neural Networks [39.59987601426039]
本稿では,時間変動トポロジに対する電力制御政策の迅速な適応を可能にする高レベル問題について検討する。
我々は,新しいネットワーク構成への数ショット適応を最適化するために,複数のトポロジのデータに一階のメタラーニングを適用した。
論文 参考訳(メタデータ) (2021-05-02T12:43:10Z) - Deep Learning-based Resource Allocation For Device-to-Device
Communication [66.74874646973593]
デバイス間通信(D2D)を用いたマルチチャネルセルシステムにおいて,リソース割り当ての最適化のためのフレームワークを提案する。
任意のチャネル条件に対する最適な資源配分戦略をディープニューラルネットワーク(DNN)モデルにより近似する深層学習(DL)フレームワークを提案する。
シミュレーションの結果,提案手法のリアルタイム性能を低速で実現できることが確認された。
論文 参考訳(メタデータ) (2020-11-25T14:19:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。