論文の概要: Semantic-Aware Collaborative Deep Reinforcement Learning Over Wireless
Cellular Networks
- arxiv url: http://arxiv.org/abs/2111.12064v1
- Date: Tue, 23 Nov 2021 18:24:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-24 15:15:49.630118
- Title: Semantic-Aware Collaborative Deep Reinforcement Learning Over Wireless
Cellular Networks
- Title(参考訳): 無線セルラーネットワークを用いたセマンティック・アウェア協調深層強化学習
- Authors: Fatemeh Lotfi, Omid Semiari, Walid Saad
- Abstract要約: 複数のエージェントが無線ネットワーク上で協調できるコラボレーティブディープ強化学習(CDRL)アルゴリズムは有望なアプローチである。
本稿では,リソース制約のある無線セルネットワーク上で,意味的にリンクされたDRLタスクを持つ未学習エージェントのグループを効率的に協調させる,新しい意味認識型CDRL手法を提案する。
- 参考スコア(独自算出の注目度): 82.02891936174221
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Collaborative deep reinforcement learning (CDRL) algorithms in which multiple
agents can coordinate over a wireless network is a promising approach to enable
future intelligent and autonomous systems that rely on real-time
decision-making in complex dynamic environments. Nonetheless, in practical
scenarios, CDRL faces many challenges due to the heterogeneity of agents and
their learning tasks, different environments, time constraints of the learning,
and resource limitations of wireless networks. To address these challenges, in
this paper, a novel semantic-aware CDRL method is proposed to enable a group of
heterogeneous untrained agents with semantically-linked DRL tasks to
collaborate efficiently across a resource-constrained wireless cellular
network. To this end, a new heterogeneous federated DRL (HFDRL) algorithm is
proposed to select the best subset of semantically relevant DRL agents for
collaboration. The proposed approach then jointly optimizes the training loss
and wireless bandwidth allocation for the cooperating selected agents in order
to train each agent within the time limit of its real-time task. Simulation
results show the superior performance of the proposed algorithm compared to
state-of-the-art baselines.
- Abstract(参考訳): 複数のエージェントが無線ネットワーク上で協調できる協調的深層学習(CDRL)アルゴリズムは、複雑な動的環境におけるリアルタイムな意思決定に依存する未来のインテリジェントで自律的なシステムを実現するための有望なアプローチである。
それでも現実のシナリオでは、cdrlはエージェントとその学習タスクの多様性、異なる環境、学習の時間的制約、無線ネットワークのリソース制限など、多くの課題に直面している。
これらの課題に対処するため,本研究では,リソース制約のある無線セルネットワーク上で,意味的にリンクされたDRLタスクを持つ異種非訓練エージェント群を効率的に協調させる,新しい意味認識型CDRL手法を提案する。
この目的のために,新しい異種連合型DRL (HFDRL) アルゴリズムを提案し,協調のための意味的関連DRLエージェントの最適サブセットを選択する。
提案手法は,リアルタイムタスクの時間制限内で各エージェントを訓練するために,協調エージェントのトレーニング損失と無線帯域割り当てを協調的に最適化する。
シミュレーションの結果,提案アルゴリズムは最先端のベースラインに比べて優れた性能を示した。
関連論文リスト
- Intelligent Hybrid Resource Allocation in MEC-assisted RAN Slicing Network [72.2456220035229]
我々は,協調型MEC支援RANスライシングシステムにおける異種サービス要求に対するSSRの最大化を目指す。
最適ハイブリッドRAポリシーをインテリジェントに学習するためのRGRLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-02T01:36:13Z) - Safe and Accelerated Deep Reinforcement Learning-based O-RAN Slicing: A
Hybrid Transfer Learning Approach [20.344810727033327]
我々は,DRLをベースとしたO-RANスライシングにおいて,安全かつ迅速な収束を実現するためのハイブリッドTL支援手法を提案し,設計する。
提案されたハイブリッドアプローチは、少なくとも7.7%と20.7%は、平均的な初期報酬値と収束シナリオの割合を改善している。
論文 参考訳(メタデータ) (2023-09-13T18:58:34Z) - MARLIN: Soft Actor-Critic based Reinforcement Learning for Congestion
Control in Real Networks [63.24965775030673]
そこで本研究では,汎用的な渋滞制御(CC)アルゴリズムを設計するための新しい強化学習(RL)手法を提案する。
我々の解であるMARLINは、Soft Actor-Criticアルゴリズムを用いてエントロピーとリターンの両方を最大化する。
我々は,MARLINを実ネットワーク上で訓練し,実ミスマッチを克服した。
論文 参考訳(メタデータ) (2023-02-02T18:27:20Z) - Pervasive Machine Learning for Smart Radio Environments Enabled by
Reconfigurable Intelligent Surfaces [56.35676570414731]
Reconfigurable Intelligent Surfaces(RIS)の新たな技術は、スマート無線環境の実現手段として準備されている。
RISは、無線媒体上の電磁信号の伝搬を動的に制御するための、高度にスケーラブルで低コストで、ハードウェア効率が高く、ほぼエネルギーニュートラルなソリューションを提供する。
このような再構成可能な無線環境におけるRISの密配置に関する大きな課題の1つは、複数の準曲面の効率的な構成である。
論文 参考訳(メタデータ) (2022-05-08T06:21:33Z) - Hierarchical Multi-Agent DRL-Based Framework for Joint Multi-RAT
Assignment and Dynamic Resource Allocation in Next-Generation HetNets [21.637440368520487]
本稿では,次世代無線ネットワーク(HetNets)における共同最適無線アクセス技術(RATs)の割り当てと電力割り当てによるコストアウェアダウンリンク総和率の問題について考察する。
本稿では,DeepRAT(DeepRAT)と呼ばれる階層型多エージェント深層強化学習(DRL)フレームワークを提案する。
特に、DeepRATフレームワークは、問題を2つの主要なステージに分解する: 単一エージェントのDeep Q Networkアルゴリズムを実装するRATs-EDs割り当てステージと、マルチエージェントのDeep Deterministic Policy Gradientを利用するパワー割り当てステージである。
論文 参考訳(メタデータ) (2022-02-28T09:49:44Z) - Reinforcement Learning-Empowered Mobile Edge Computing for 6G Edge
Intelligence [76.96698721128406]
モバイルエッジコンピューティング(MEC)は、第5世代(5G)ネットワークなどにおける計算と遅延に敏感なタスクのための新しいパラダイムであると考えた。
本稿では、フリー対応RLに関する総合的な研究レビューと、開発のための洞察を提供する。
論文 参考訳(メタデータ) (2022-01-27T10:02:54Z) - Combining Pessimism with Optimism for Robust and Efficient Model-Based
Deep Reinforcement Learning [56.17667147101263]
実世界のタスクでは、強化学習エージェントはトレーニング中に存在しない状況に遭遇する。
信頼性を確保するため、RLエージェントは最悪の状況に対して堅牢性を示す必要がある。
本稿では,Robust Hallucinated Upper-Confidence RL (RH-UCRL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-18T16:50:17Z) - Deep Reinforcement Learning for Resource Constrained Multiclass
Scheduling in Wireless Networks [0.0]
セットアップでは、ランダムに到着するサービス要求に対応するために、利用可能な限られた帯域幅のリソースを割り当てます。
本稿では,Deep Setsと組み合わせた分布型Deep Deterministic Policy Gradient (DDPG)アルゴリズムを提案する。
提案アルゴリズムは, 合成データと実データの両方で検証し, 従来手法に対する一貫した利得を示す。
論文 参考訳(メタデータ) (2020-11-27T09:49:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。