論文の概要: Deep Reinforcement Learning with Spatio-temporal Traffic Forecasting for
Data-Driven Base Station Sleep Control
- arxiv url: http://arxiv.org/abs/2101.08391v1
- Date: Thu, 21 Jan 2021 01:39:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-21 07:49:21.267874
- Title: Deep Reinforcement Learning with Spatio-temporal Traffic Forecasting for
Data-Driven Base Station Sleep Control
- Title(参考訳): データ駆動ベースステーション睡眠制御のための時空間トラヒック予測を用いた深層強化学習
- Authors: Qiong Wu and Xu Chen and Zhi Zhou and Liang Chen and Junshan Zhang
- Abstract要約: 5G時代のモバイル交通需要の増加に対応するため、基地局(BS)は無線アクセスネットワーク(RAN)に密に展開され、ネットワークカバレッジと容量が向上しています。
BSの高密度はピークトラフィックに対応するために設計されているため、オフピーク時にBSがオンになっている場合、不必要に大量のエネルギーを消費します。
セルラーネットワークのエネルギー消費を抑えるために、交通需要に応えないアイドルベースステーションを非活性化する方法が効果的である。
本論文では,DeepBSC と呼ばれるトラフィック認識型動的 BS 睡眠制御フレームワークを開発した。
- 参考スコア(独自算出の注目度): 39.31623488192675
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To meet the ever increasing mobile traffic demand in 5G era, base stations
(BSs) have been densely deployed in radio access networks (RANs) to increase
the network coverage and capacity. However, as the high density of BSs is
designed to accommodate peak traffic, it would consume an unnecessarily large
amount of energy if BSs are on during off-peak time. To save the energy
consumption of cellular networks, an effective way is to deactivate some idle
base stations that do not serve any traffic demand. In this paper, we develop a
traffic-aware dynamic BS sleep control framework, named DeepBSC, which presents
a novel data-driven learning approach to determine the BS active/sleep modes
while meeting lower energy consumption and satisfactory Quality of Service
(QoS) requirements. Specifically, the traffic demands are predicted by the
proposed GS-STN model, which leverages the geographical and semantic
spatial-temporal correlations of mobile traffic. With accurate mobile traffic
forecasting, the BS sleep control problem is cast as a Markov Decision Process
that is solved by Actor-Critic reinforcement learning methods. To reduce the
variance of cost estimation in the dynamic environment, we propose a benchmark
transformation method that provides robust performance indicator for policy
update. To expedite the training process, we adopt a Deep Deterministic Policy
Gradient (DDPG) approach, together with an explorer network, which can
strengthen the exploration further. Extensive experiments with a real-world
dataset corroborate that our proposed framework significantly outperforms the
existing methods.
- Abstract(参考訳): 5g時代のモバイルトラフィックの増加に対応するため、基地局(bss)は無線アクセスネットワーク(ran)に密に配置され、ネットワークのカバレッジとキャパシティが向上している。
しかし、高密度のBSsはピークトラフィックに対応するように設計されているため、オフピーク時にBSsがオンになっている場合、不要に大量のエネルギーを消費する。
セルラーネットワークのエネルギー消費を抑えるために、交通需要に応えないアイドルベースステーションを非活性化する方法が効果的である。
本稿では,より少ないエネルギー消費とQoS(Quality of Service)要件を満たしつつ,BSのアクティブ/スリープモードを決定するための新しいデータ駆動学習手法であるDeepBSCという,トラフィックを考慮した動的BS睡眠制御フレームワークを開発する。
具体的には,移動トラフィックの地理的および意味的空間的相関を利用したGS-STNモデルにより交通需要を予測する。
正確な移動トラヒック予測では、bs睡眠制御問題をマルコフ決定プロセスとしてキャストし、アクタ-クリティック強化学習法によって解決する。
動的環境におけるコスト推定のばらつきを低減すべく,ポリシー更新にロバストなパフォーマンス指標を提供するベンチマーク変換手法を提案する。
トレーニングプロセスを迅速化するために,我々は,探索をさらに強化するエクスプローラネットワークとともに,ddpg(deep deterministic policy gradient)アプローチを採用する。
実世界のデータセットを用いた広範囲な実験は、提案フレームワークが既存のメソッドを大幅に上回っていることを裏付ける。
関連論文リスト
- Decentralized Federated Reinforcement Learning for User-Centric Dynamic
TFDD Control [37.54493447920386]
非対称かつ不均一なトラフィック要求を満たすための学習に基づく動的時間周波数分割二重化(D-TFDD)方式を提案する。
分散化された部分観測可能なマルコフ決定過程(Dec-POMDP)として問題を定式化する。
本稿では,グローバルリソースを分散的に最適化するために,Wolpertinger Deep Deterministic Policy gradient (FWDDPG)アルゴリズムという,連合強化学習(RL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-11-04T07:39:21Z) - Correlating sparse sensing for network-wide traffic speed estimation: An
integrated graph tensor-based kriging approach [76.45949280328838]
交通速度は道路網の流動性を特徴づける中心である。
センサと通信技術の急速な進歩は、交通速度の検出をこれまで以上に容易にする。
しかし, 移動体センサの分散配置や低浸透により, 速度は不完全であり, ネットワーク全体には及ばない。
論文 参考訳(メタデータ) (2022-10-21T07:25:57Z) - AI-aided Traffic Control Scheme for M2M Communications in the Internet
of Vehicles [61.21359293642559]
交通のダイナミクスと異なるIoVアプリケーションの異種要求は、既存のほとんどの研究では考慮されていない。
本稿では,ハイブリッド交通制御方式とPPO法を併用して検討する。
論文 参考訳(メタデータ) (2022-03-05T10:54:05Z) - A Deep Reinforcement Learning Approach for Traffic Signal Control
Optimization [14.455497228170646]
非効率な信号制御手法は、交通渋滞やエネルギー浪費などの多くの問題を引き起こす可能性がある。
本稿では,アクター・クリティカル・ポリシー・グラデーション・アルゴリズムを拡張し,マルチエージェント・ディープ・決定性ポリシー・グラデーション(MADDPG)法を提案する。
論文 参考訳(メタデータ) (2021-07-13T14:11:04Z) - Energy-Efficient Model Compression and Splitting for Collaborative
Inference Over Time-Varying Channels [52.60092598312894]
本稿では,エッジノードとリモートノード間のモデル圧縮と時間変化モデル分割を利用して,エッジデバイスにおける総エネルギーコストを削減する手法を提案する。
提案手法は, 検討されたベースラインと比較して, エネルギー消費が最小限であり, 排出コストが$CO$となる。
論文 参考訳(メタデータ) (2021-06-02T07:36:27Z) - AdaPool: A Diurnal-Adaptive Fleet Management Framework using Model-Free
Deep Reinforcement Learning and Change Point Detection [34.77250498401055]
本稿では,車いすによる乗り合い環境における日中パターンを認識・適応できる適応型モデルフリー深部強化手法を提案する。
本論文では, 配車における適応論理に加えて, 動的かつ需要に応じた車両通行者マッチングと経路計画の枠組みを提案する。
論文 参考訳(メタデータ) (2021-04-01T02:14:01Z) - Traffic Flow Estimation using LTE Radio Frequency Counters and Machine
Learning [0.0]
本稿では,LTE/4G無線周波数性能測定カウンタを用いた新しいトラフィックフロー推定手法を提案する。
我々のアプローチは、時間だけでなく空間においてもソリューションを一般化するためにトランスファーラーニングを適用することの利点が示される。
論文 参考訳(メタデータ) (2021-01-22T15:05:10Z) - Computation Offloading in Heterogeneous Vehicular Edge Networks: On-line
and Off-policy Bandit Solutions [30.606518785629046]
高速変動車体環境では、ネットワークの混雑によりオフロードの遅延が発生する。
本稿では,バンディット理論に基づくオンラインアルゴリズムと非政治学習アルゴリズムを提案する。
提案手法は,最も混雑の少ないネットワークを選択することで,ネットワークのトラフィック変化に適応することを示す。
論文 参考訳(メタデータ) (2020-08-14T11:48:13Z) - Meta-Reinforcement Learning for Trajectory Design in Wireless UAV
Networks [151.65541208130995]
ドローン基地局(DBS)は、要求が動的で予測不可能な地上ユーザーへのアップリンク接続を提供するために派遣される。
この場合、DBSの軌道は動的ユーザアクセス要求を満たすように適応的に調整されなければならない。
新たな環境に遭遇したDBSの軌道に適応するために,メタラーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-25T20:43:59Z) - Data Freshness and Energy-Efficient UAV Navigation Optimization: A Deep
Reinforcement Learning Approach [88.45509934702913]
我々は、移動基地局(BS)が配備される複数の無人航空機(UAV)のナビゲーションポリシーを設計する。
我々は、地上BSにおけるデータの鮮度を確保するために、エネルギーや情報年齢(AoI)の制約などの異なる文脈情報を組み込んだ。
提案したトレーニングモデルを適用することで、UAV-BSに対する効果的なリアルタイム軌道ポリシーは、時間とともに観測可能なネットワーク状態をキャプチャする。
論文 参考訳(メタデータ) (2020-02-21T07:29:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。