論文の概要: Reinforcement Learning for Cognitive Delay/Disruption Tolerant Network
Node Management in an LEO-based Satellite Constellation
- arxiv url: http://arxiv.org/abs/2209.13237v1
- Date: Tue, 27 Sep 2022 08:18:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 15:08:05.126055
- Title: Reinforcement Learning for Cognitive Delay/Disruption Tolerant Network
Node Management in an LEO-based Satellite Constellation
- Title(参考訳): LEO衛星コンステレーションにおける認知遅延/破壊耐性ネットワークノード管理のための強化学習
- Authors: Xue Sun, Changhao Li, Lei Yan, Suzhi Cao
- Abstract要約: 本稿では,低地球軌道(LEO)衛星コンステレーションシナリオにおける認知DTNノードの自動管理手法を提案する。
A2Cエージェントの目標は、デリバリ成功率を最大化し、ネットワークリソース消費コストを最小化することである。
実験によると、A2C戦略はデリバリ成功率とコストのバランスを保ち、最高報酬と最低ノードメモリ利用率を提供する。
- 参考スコア(独自算出の注目度): 4.571414974651197
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, with the large-scale deployment of space spacecraft entities
and the increase of satellite onboard capabilities, delay/disruption tolerant
network (DTN) emerged as a more robust communication protocol than TCP/IP in
the case of excessive network dynamics. DTN node buffer management is still an
active area of research, as the current implementation of the DTN core protocol
still relies on the assumption that there is always enough memory available in
different network nodes to store and forward bundles. In addition, the
classical queuing theory does not apply to the dynamic management of DTN node
buffers. Therefore, this paper proposes a centralized approach to automatically
manage cognitive DTN nodes in low earth orbit (LEO) satellite constellation
scenarios based on the advanced reinforcement learning (RL) strategy advantage
actor-critic (A2C). The method aims to explore training a geosynchronous earth
orbit intelligent agent to manage all DTN nodes in an LEO satellite
constellation scenario. The goal of the A2C agent is to maximize delivery
success rate and minimize network resource consumption cost while considering
node memory utilization. The intelligent agent can dynamically adjust the radio
data rate and perform drop operations based on bundle priority. In order to
measure the effectiveness of applying A2C technology to DTN node management
issues in LEO satellite constellation scenarios, this paper compares the
trained intelligent agent strategy with the other two non-RL policies,
including random and standard policies. Experiments show that the A2C strategy
balances delivery success rate and cost, and provides the highest reward and
the lowest node memory utilization.
- Abstract(参考訳): 近年、宇宙船の大規模展開と衛星搭載能力の増大により、遅延/破壊耐性ネットワーク(DTN)は、過度なネットワークダイナミクスの場合にTCP/IPよりも堅牢な通信プロトコルとして出現している。
DTNノードバッファ管理は依然として研究の活発な領域であり、DTNコアプロトコルの現在の実装は、バンドルを保存および転送するために、異なるネットワークノードに常に十分なメモリが存在するという仮定に依存している。
加えて、古典キューイング理論はdtnノードバッファの動的管理には適用されない。
そこで本稿では,低地球軌道 (LEO) 衛星コンステレーションシナリオにおける認知DTNノードの自動管理を,アクタ・クリティカル (A2C) を利用した高度強化学習 (RL) 戦略に基づいて一元管理する手法を提案する。
LEO衛星コンステレーションシナリオにおけるすべてのDTNノードを管理するために、地球同期軌道知的エージェントの訓練を検討することを目的としている。
A2Cエージェントの目標は、ノードメモリ利用を考慮したデリバリ成功率の最大化と、ネットワークリソース消費コストの最小化である。
インテリジェントエージェントは、無線データレートを動的に調整し、バンドル優先度に基づいてドロップ操作を行うことができる。
本稿では,leo衛星コンステレーションにおけるdtnノード管理問題に対するa2c技術の適用効果を評価するために,訓練されたインテリジェントエージェント戦略と,ランダムおよび標準ポリシーを含む他の2つの非rlポリシーを比較した。
実験によると、A2C戦略はデリバリ成功率とコストのバランスを保ち、最高報酬と最低ノードメモリ利用率を提供する。
関連論文リスト
- Demand-Aware Beam Hopping and Power Allocation for Load Balancing in Digital Twin empowered LEO Satellite Networks [6.8053434130447625]
ビームホッピング(BH)技術を利用した低地球軌道(LEO)衛星は、広範囲のカバレッジ、低レイテンシ、高帯域幅、大きな柔軟性を提供する。
従来のビームホッピング(BH)法は、衛星干渉、重なり合うカバー、モビリティといった問題に対処できない。
本稿では,複数のLEO衛星を対象としたDigital Twin(DT)を用いた協調資源割り当てネットワークについて検討する。
論文 参考訳(メタデータ) (2024-10-29T01:32:11Z) - FusionLLM: A Decentralized LLM Training System on Geo-distributed GPUs with Adaptive Compression [55.992528247880685]
分散トレーニングは、システム設計と効率に関する重要な課題に直面します。
大規模深層ニューラルネットワーク(DNN)のトレーニング用に設計・実装された分散トレーニングシステムFusionLLMを提案する。
本システムと手法は,収束性を確保しつつ,ベースライン法と比較して1.45~9.39倍の高速化を実現可能であることを示す。
論文 参考訳(メタデータ) (2024-10-16T16:13:19Z) - A Neural Radiance Field-Based Architecture for Intelligent Multilayered
View Synthesis [0.0]
モバイルアドホックネットワーク(MANET)は、モバイルノードの巨大かつ合理的に密集したコミュニティで構成されている。
インフラストラクチャ間で最高のパケットルーティングを見つけることが大きな問題です。
本研究は、オンデマンドソースルーティングシステムを改善する手段として、Red Imported Fire Ants (RIFA) 戦略による最適経路選択を提案する。
論文 参考訳(メタデータ) (2023-11-03T11:05:51Z) - Unsupervised Deep Unfolded PGD for Transmit Power Allocation in Wireless
Systems [0.6091702876917281]
本稿では,反復射影勾配(PGD)アルゴリズムをニューラルネットワークの層に深く展開し,ステップサイズパラメータを学習する,単純な低複素性TPCアルゴリズムを提案する。
高密度デバイス間通信(D2D)における性能評価の結果,提案手法は2回以上の繰り返し回数で反復アルゴリズムよりも優れた性能が得られることがわかった。
論文 参考訳(メタデータ) (2023-06-20T19:51:21Z) - DRL Enabled Coverage and Capacity Optimization in STAR-RIS Assisted
Networks [55.0821435415241]
無線通信における新たなパラダイムとして,STAR-RISのカバレッジとキャパシティ性能の分析が不可欠だが難しい。
STAR-RIS支援ネットワークにおけるカバレッジとキャパシティ最適化の問題を解決するために,多目的ポリシー最適化(MO-PPO)アルゴリズムを提案する。
MO-PPOアルゴリズムの性能向上のために、アクション値ベースの更新戦略(AVUS)と損失関数ベースの更新戦略(LFUS)の2つの更新戦略を検討した。
論文 参考訳(メタデータ) (2022-09-01T14:54:36Z) - Learning Emergent Random Access Protocol for LEO Satellite Networks [51.575090080749554]
創発的ランダムアクセスチャネルプロトコル(eRACH)と呼ばれるLEO SATネットワークのための新しい許可なしランダムアクセスソリューションを提案する。
eRACHは、非定常ネットワーク環境との相互作用によって生じるモデルフリーなアプローチである。
RACHと比較して,提案するeRACHは平均ネットワークスループットが54.6%向上することを示す。
論文 参考訳(メタデータ) (2021-12-03T07:44:45Z) - Adaptive Stochastic ADMM for Decentralized Reinforcement Learning in
Edge Industrial IoT [106.83952081124195]
強化学習 (Reinforcement Learning, RL) は, 意思決定および最適制御プロセスのための有望な解法として広く研究されている。
本稿では,Adaptive ADMM (asI-ADMM)アルゴリズムを提案する。
実験の結果,提案アルゴリズムは通信コストやスケーラビリティの観点から技術状況よりも優れており,複雑なIoT環境に適応できることがわかった。
論文 参考訳(メタデータ) (2021-06-30T16:49:07Z) - Medium Access using Distributed Reinforcement Learning for IoTs with
Low-Complexity Wireless Transceivers [2.6397379133308214]
本論文では,低複雑性無線トランシーバを用いたIoTネットワークにおけるMAC層無線プロトコルに使用できる分散強化学習(RL)ベースのフレームワークを提案する。
このフレームワークでは、アクセスプロトコルをまずMarkov Decision Processs (MDP) として定式化し、次にRLを用いて解決する。
本論文は,学習パラダイムの性能と,ノードが様々なネットワークダイナミクスに応答して,その最適伝達戦略をオンザフライで適応させる能力を示す。
論文 参考訳(メタデータ) (2021-04-29T17:57:43Z) - Deep Learning-based Resource Allocation For Device-to-Device
Communication [66.74874646973593]
デバイス間通信(D2D)を用いたマルチチャネルセルシステムにおいて,リソース割り当ての最適化のためのフレームワークを提案する。
任意のチャネル条件に対する最適な資源配分戦略をディープニューラルネットワーク(DNN)モデルにより近似する深層学習(DL)フレームワークを提案する。
シミュレーションの結果,提案手法のリアルタイム性能を低速で実現できることが確認された。
論文 参考訳(メタデータ) (2020-11-25T14:19:23Z) - Resource Allocation via Graph Neural Networks in Free Space Optical
Fronthaul Networks [119.81868223344173]
本稿では,自由空間光(FSO)フロントホールネットワークにおける最適資源割り当てについて検討する。
我々は、FSOネットワーク構造を利用するために、ポリシーパラメータ化のためのグラフニューラルネットワーク(GNN)を検討する。
本アルゴリズムは,システムモデルに関する知識が不要なモデルフリーでGNNを訓練するために開発された。
論文 参考訳(メタデータ) (2020-06-26T14:20:48Z) - Decentralized SGD with Over-the-Air Computation [13.159777131162961]
無線ネットワークにおける分散数値勾配降下(DSGD)の性能について検討する。
伝送は付加的なノイズや干渉を生じやすいと仮定する。
OAC-MAC方式はより少ない通信ラウンドでコンバージェンス性能が向上することを示す。
論文 参考訳(メタデータ) (2020-03-06T15:33:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。