論文の概要: An Intelligent SDWN Routing Algorithm Based on Network Situational
Awareness and Deep Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2305.10441v1
- Date: Fri, 12 May 2023 14:18:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-21 10:23:44.479985
- Title: An Intelligent SDWN Routing Algorithm Based on Network Situational
Awareness and Deep Reinforcement Learning
- Title(参考訳): ネットワーク状況認識と深層強化学習に基づくインテリジェントsdwnルーティングアルゴリズム
- Authors: Jinqiang Li, Miao Ye, Linqiang Huang, Xiaofang Deng, Hongbing Qiu and
Yong Wang
- Abstract要約: 本稿では、ネットワーク状況認識による深層強化学習に基づくインテリジェントルーティングアルゴリズム(DRL-PPONSA)を紹介する。
実験の結果,DRL-PPONSAはネットワークスループット,遅延,パケット損失率,無線ノード距離において従来のルーティング手法よりも優れていた。
- 参考スコア(独自算出の注目度): 4.085916808788356
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Due to the highly dynamic changes in wireless network topologies, efficiently
obtaining network status information and flexibly forwarding data to improve
communication quality of service are important challenges. This article
introduces an intelligent routing algorithm (DRL-PPONSA) based on proximal
policy optimization deep reinforcement learning with network situational
awareness under a software-defined wireless networking architecture. First, a
specific data plane is designed for network topology construction and data
forwarding. The control plane collects network traffic information, sends flow
tables, and uses a GCN-GRU prediction mechanism to perceive future traffic
change trends to achieve network situational awareness. Second, a DRL-based
data forwarding mechanism is designed in the knowledge plane. The predicted
network traffic matrix and topology information matrix are treated as the
environment for DRL agents, while next-hop adjacent nodes are treated as
executable actions. Accordingly, action selection strategies are designed for
different network conditions to achieve more intelligent, flexible, and
efficient routing control. The reward function is designed using network link
information and various reward and penalty mechanisms. Additionally, importance
sampling and gradient clipping techniques are employed during gradient updating
to enhance convergence speed and stability. Experimental results show that
DRL-PPONSA outperforms traditional routing methods in network throughput,
delay, packet loss rate, and wireless node distance. Compared to
value-function-based Dueling DQN routing, the convergence speed is
significantly improved, and the convergence effect is more stable.
Simultaneously, its consumption of hardware storage space is reduced, and
efficient routing decisions can be made in real-time using the current network
state information.
- Abstract(参考訳): 無線ネットワークトポロジの高度にダイナミックな変化のため,通信品質を向上させるために,効率的にネットワーク状態情報を取得し,データを柔軟に転送することが重要な課題である。
本稿では,ソフトウェア定義無線ネットワークアーキテクチャによるネットワーク状況認識を伴う深層強化学習に基づくインテリジェントルーティングアルゴリズム(drl-pponsa)を提案する。
まず、特定のデータプレーンは、ネットワークトポロジの構築とデータ転送のために設計されます。
制御プレーンは、ネットワークトラフィック情報を収集し、フローテーブルを送信し、GCN-GRU予測機構を使用して、将来のトラフィック変化トレンドを認識し、ネットワーク状況認識を実現する。
第2に、DRLに基づくデータ転送機構を知識平面に設計する。
予測されたネットワークトラフィックマトリクスとトポロジ情報マトリクスはdrlエージェントの環境として扱われ、隣り合うノードは実行可能アクションとして扱われる。
したがって、アクション選択戦略は、よりインテリジェントで柔軟で効率的なルーティング制御を実現するために、異なるネットワーク条件のために設計される。
報酬機能は、ネットワークリンク情報と様々な報酬・ペナルティ機構を用いて設計されている。
さらに、勾配更新時に重要サンプリングと勾配クリッピング技術を用い、収束速度と安定性を高める。
実験の結果,DRL-PPONSAはネットワークスループット,遅延,パケット損失率,無線ノード距離において従来のルーティング手法よりも優れていた。
値関数に基づくデュアリングDQNルーティングと比較して、収束速度は大幅に改善され、収束効果はより安定である。
同時に、ハードウェアストレージ空間の消費を削減し、現在のネットワーク状態情報を用いて、効率的なルーティング決定をリアルタイムに行うことができる。
関連論文リスト
- DRL Optimization Trajectory Generation via Wireless Network Intent-Guided Diffusion Models for Optimizing Resource Allocation [58.62766376631344]
本稿では、無線通信ネットワークの異なる状態変化に対応するために、カスタマイズされた無線ネットワークインテント(WNI-G)モデルを提案する。
大規模シミュレーションにより、動的通信システムにおけるスペクトル効率と従来のDRLモデルの変動の安定性が向上する。
論文 参考訳(メタデータ) (2024-10-18T14:04:38Z) - Improved Q-learning based Multi-hop Routing for UAV-Assisted Communication [4.799822253865053]
本稿では,Q-Learning-based Multi-hop Routing (IQMR) アルゴリズムを提案する。
ルーティング決定にQ(lambda)学習を用いることで、IQMRはエネルギー効率とネットワークデータのスループットを大幅に向上する。
論文 参考訳(メタデータ) (2024-08-17T06:24:31Z) - A Deep Reinforcement Learning Approach for Adaptive Traffic Routing in
Next-gen Networks [1.1586742546971471]
次世代ネットワークは、トラフィックダイナミクスに基づいたネットワーク構成を自動化し、適応的に調整する必要がある。
交通政策を決定する伝統的な手法は、通常は手作りのプログラミング最適化とアルゴリズムに基づいている。
我々は適応的なトラフィックルーティングのための深層強化学習(DRL)アプローチを開発する。
論文 参考訳(メタデータ) (2024-02-07T01:48:29Z) - Learning State-Augmented Policies for Information Routing in
Communication Networks [92.59624401684083]
我々は,グラフニューラルネットワーク(GNN)アーキテクチャを用いて,ソースノードの集約情報を最大化する,新たなステート拡張(SA)戦略を開発した。
教師なし学習手法を利用して、GNNアーキテクチャの出力を最適情報ルーティング戦略に変換する。
実験では,実時間ネットワークトポロジの評価を行い,アルゴリズムの有効性を検証した。
論文 参考訳(メタデータ) (2023-09-30T04:34:25Z) - Multi-agent Reinforcement Learning with Graph Q-Networks for Antenna
Tuning [60.94661435297309]
モバイルネットワークの規模は、手作業による介入や手作業による戦略を使ってアンテナパラメータの最適化を困難にしている。
本研究では,モバイルネットワーク構成をグローバルに最適化するマルチエージェント強化学習アルゴリズムを提案する。
シミュレーション環境におけるアンテナ傾き調整問題とジョイント傾き・電力制御問題に対するアルゴリズムの性能を実証的に示す。
論文 参考訳(メタデータ) (2023-01-20T17:06:34Z) - Robust Path Selection in Software-defined WANs using Deep Reinforcement
Learning [18.586260468459386]
本稿では、経路計算と経路更新のオーバーヘッドを考慮した、ネットワーク内の経路選択を行うデータ駆動アルゴリズムを提案する。
提案手法は,ECMPなどの従来のTE方式に比べてリンク利用率を40%削減できる。
論文 参考訳(メタデータ) (2022-12-21T16:08:47Z) - Deep Reinforcement Learning Aided Packet-Routing For Aeronautical Ad-Hoc
Networks Formed by Passenger Planes [99.54065757867554]
エンド・ツー・エンド(E2E)遅延の最小化を目的としたAANETにおけるルーティングのための深層強化学習を起動する。
最深Qネットワーク(DQN)は、転送ノードで観測される最適ルーティング決定と局所的な地理的情報との関係をキャプチャする。
フィードバック機構を組み込んだディープバリューネットワーク(DVN)を用いて,システムのダイナミクスに関する知識をさらに活用する。
論文 参考訳(メタデータ) (2021-10-28T14:18:56Z) - Deep Learning Aided Packet Routing in Aeronautical Ad-Hoc Networks
Relying on Real Flight Data: From Single-Objective to Near-Pareto
Multi-Objective Optimization [79.96177511319713]
航空アドホックネットワーク(AANET)のルーティングを支援するために、ディープラーニング(DL)を起動する。
フォワードノードによって観測された局所的な地理的情報を最適な次のホップを決定するために必要な情報にマッピングするために、ディープニューラルネットワーク(DNN)が考案される。
DL支援ルーティングアルゴリズムを多目的シナリオに拡張し,遅延を最小化し,経路容量を最大化し,経路寿命を最大化する。
論文 参考訳(メタデータ) (2021-10-28T14:18:22Z) - Federated Learning over Wireless IoT Networks with Optimized
Communication and Resources [98.18365881575805]
協調学習技術のパラダイムとしてのフェデレートラーニング(FL)は研究の注目を集めている。
無線システム上での高速応答および高精度FLスキームの検証が重要である。
提案する通信効率のよいフェデレーション学習フレームワークは,強い線形速度で収束することを示す。
論文 参考訳(メタデータ) (2021-10-22T13:25:57Z) - Packet Routing with Graph Attention Multi-agent Reinforcement Learning [4.78921052969006]
我々は強化学習(RL)を利用したモデルフリーでデータ駆動型ルーティング戦略を開発する。
ネットワークトポロジのグラフ特性を考慮すると、グラフニューラルネットワーク(GNN)と組み合わせたマルチエージェントRLフレームワークを設計する。
論文 参考訳(メタデータ) (2021-07-28T06:20:34Z) - Relational Deep Reinforcement Learning for Routing in Wireless Networks [2.997420836766863]
我々は,トラフィックパターン,混雑レベル,ネットワーク接続性,リンクダイナミクスを一般化した,深層強化学習に基づく分散ルーティング戦略を開発した。
提案アルゴリズムは,パケットの配送やパケット毎の遅延に対して,最短経路とバックプレッシャルーティングに優れる。
論文 参考訳(メタデータ) (2020-12-31T16:28:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。