論文の概要: Adapting to Dynamic LEO-B5G Systems: Meta-Critic Learning Based
Efficient Resource Scheduling
- arxiv url: http://arxiv.org/abs/2110.06787v1
- Date: Wed, 13 Oct 2021 15:21:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-14 14:02:42.574615
- Title: Adapting to Dynamic LEO-B5G Systems: Meta-Critic Learning Based
Efficient Resource Scheduling
- Title(参考訳): 動的leo-b5gシステムへの適応:メタ批判学習に基づく効率的な資源スケジューリング
- Authors: Yaxiong Yuan, Lei lei, Thang X. Vu, Zheng Chang, Symeon Chatzinotas,
Sumei Sun
- Abstract要約: オーバーロードされたLEO地上システムにおける2つの実用的課題に対処する。
最初の課題は、膨大な数の接続されたユーザに対して、リソースを効率的にスケジュールする方法です。
第2の課題は、動的無線環境への適応において、アルゴリズムによるソリューションをよりレジリエントにする方法だ。
- 参考スコア(独自算出の注目度): 38.733584547351796
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Low earth orbit (LEO) satellite-assisted communications have been considered
as one of key elements in beyond 5G systems to provide wide coverage and
cost-efficient data services. Such dynamic space-terrestrial topologies impose
exponential increase in the degrees of freedom in network management. In this
paper, we address two practical issues for an over-loaded LEO-terrestrial
system. The first challenge is how to efficiently schedule resources to serve
the massive number of connected users, such that more data and users can be
delivered/served. The second challenge is how to make the algorithmic solution
more resilient in adapting to dynamic wireless environments.To address them, we
first propose an iterative suboptimal algorithm to provide an offline
benchmark. To adapt to unforeseen variations, we propose an enhanced
meta-critic learning algorithm (EMCL), where a hybrid neural network for
parameterization and the Wolpertinger policy for action mapping are designed in
EMCL. The results demonstrate EMCL's effectiveness and fast-response
capabilities in over-loaded systems and in adapting to dynamic environments
compare to previous actor-critic and meta-learning methods.
- Abstract(参考訳): 低地球軌道(LEO)衛星による通信は、5Gシステムを超える重要な要素の1つと考えられており、広い範囲と費用効率のよいデータサービスを提供している。
このような動的空間-地上トポロジーは、ネットワーク管理の自由度を指数関数的に増加させる。
本稿では,過負荷leo-地球系における2つの実用的課題について述べる。
最初の課題は、大量の接続されたユーザに対して、より多くのデータやユーザを配信/提供できるように、リソースを効率的にスケジュールする方法です。
第2の課題は、動的無線環境に適応するアルゴリズムソリューションをよりレジリエントなものにする方法であり、その対策として、まず、オフラインベンチマークを提供するための反復的部分最適化アルゴリズムを提案する。
そこで本研究では,パラメータ化のためのハイブリッドニューラルネットワークと,アクションマッピングのためのwolpertingerポリシーをemclで設計した,メタクリティック学習アルゴリズム(emcl)を提案する。
その結果, 過負荷システムにおけるEMCLの有効性と迅速な応答能力, 動的環境への適応性を示す。
関連論文リスト
- Doubly-Dynamic ISAC Precoding for Vehicular Networks: A Constrained Deep Reinforcement Learning (CDRL) Approach [11.770137653756697]
車両ネットワークを支えるためにはISAC技術が不可欠である。
このシナリオの通信チャネルは時間変化を示し、潜在的なターゲットは急速に移動し、二重ダイナミクスをもたらす。
制約付き強化学習を用いてISACプリコーダの動的更新を容易にすることを提案する。
論文 参考訳(メタデータ) (2024-05-23T09:19:14Z) - Context-Aware Orchestration of Energy-Efficient Gossip Learning Schemes [8.382766344930157]
本稿では,Gossip Learningと学習プロセスの適応最適化を組み合わせた分散学習手法を提案する。
本稿では,ノードごとのリアルタイムな最適化に依存するデータ駆動型OGL管理手法を提案する。
その結果,提案手法は幅広いネットワークシナリオにおいて極めて効率的かつ効果的であることが示唆された。
論文 参考訳(メタデータ) (2024-04-18T09:17:46Z) - Hybrid-Task Meta-Learning: A Graph Neural Network Approach for Scalable and Transferable Bandwidth Allocation [46.342827102556896]
ユーザ数に応じてスケーラブルで,異なる通信シナリオに転送可能な,ディープラーニングベースの帯域割り当てポリシを開発する。
スケーラビリティをサポートするために、帯域割り当てポリシーはグラフニューラルネットワーク(GNN)によって表現される。
我々は,GNNの初期パラメータを異なる通信シナリオで学習するハイブリッドタスクメタ学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-12-23T04:25:12Z) - Adaptive Resource Allocation for Virtualized Base Stations in O-RAN with
Online Learning [60.17407932691429]
基地局(vBS)を備えたオープンラジオアクセスネットワークシステムは、柔軟性の向上、コスト削減、ベンダーの多様性、相互運用性のメリットを提供する。
本研究では,予期せぬ「混み合う」環境下であっても,効率的なスループットとvBSエネルギー消費のバランスをとるオンライン学習アルゴリズムを提案する。
提案手法は, 課題のある環境においても, 平均最適性ギャップをゼロにすることで, サブ線形後悔を実現する。
論文 参考訳(メタデータ) (2023-09-04T17:30:21Z) - Multi-agent Reinforcement Learning with Graph Q-Networks for Antenna
Tuning [60.94661435297309]
モバイルネットワークの規模は、手作業による介入や手作業による戦略を使ってアンテナパラメータの最適化を困難にしている。
本研究では,モバイルネットワーク構成をグローバルに最適化するマルチエージェント強化学習アルゴリズムを提案する。
シミュレーション環境におけるアンテナ傾き調整問題とジョイント傾き・電力制御問題に対するアルゴリズムの性能を実証的に示す。
論文 参考訳(メタデータ) (2023-01-20T17:06:34Z) - Learning to Continuously Optimize Wireless Resource in a Dynamic
Environment: A Bilevel Optimization Perspective [52.497514255040514]
この研究は、データ駆動メソッドが動的環境でリソース割り当て戦略を継続的に学び、最適化することを可能にする新しいアプローチを開発しています。
学習モデルが新たなエピソードに段階的に適応できるように、連続学習の概念を無線システム設計に組み込むことを提案する。
我々の設計は、異なるデータサンプルにまたがる公平性を保証する、新しい二段階最適化定式化に基づいている。
論文 参考訳(メタデータ) (2021-05-03T07:23:39Z) - Deep Learning-based Resource Allocation For Device-to-Device
Communication [66.74874646973593]
デバイス間通信(D2D)を用いたマルチチャネルセルシステムにおいて,リソース割り当ての最適化のためのフレームワークを提案する。
任意のチャネル条件に対する最適な資源配分戦略をディープニューラルネットワーク(DNN)モデルにより近似する深層学習(DL)フレームワークを提案する。
シミュレーションの結果,提案手法のリアルタイム性能を低速で実現できることが確認された。
論文 参考訳(メタデータ) (2020-11-25T14:19:23Z) - Meta-Reinforcement Learning for Trajectory Design in Wireless UAV
Networks [151.65541208130995]
ドローン基地局(DBS)は、要求が動的で予測不可能な地上ユーザーへのアップリンク接続を提供するために派遣される。
この場合、DBSの軌道は動的ユーザアクセス要求を満たすように適応的に調整されなければならない。
新たな環境に遭遇したDBSの軌道に適応するために,メタラーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-25T20:43:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。