論文の概要: Deep Reinforcement Learning-Based Beam Tracking for Low-Latency Services
in Vehicular Networks
- arxiv url: http://arxiv.org/abs/2002.05564v1
- Date: Thu, 13 Feb 2020 15:21:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-01 13:57:45.643334
- Title: Deep Reinforcement Learning-Based Beam Tracking for Low-Latency Services
in Vehicular Networks
- Title(参考訳): 深部強化学習に基づく低レイテンシネットワーク用ビームトラッキング
- Authors: Yan Liu, Zhiyuan Jiang, Shunqing Zhang, Shugong Xu
- Abstract要約: ミリ波帯の車両ネットワークにおける超信頼性・低レイテンシ通信(URLLC)は大きな課題である。
本稿では,まず,拡張カルマンフィルタ (EKF) や粒子フィルタ (PF) などの古典的手法を改良した。
次に、典型的な交差点シナリオにおいて、URLLC要求を達成することができる強化学習(RL)ベースのアプローチを提案する。
- 参考スコア(独自算出の注目度): 39.407929561526906
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Ultra-Reliable and Low-Latency Communications (URLLC) services in vehicular
networks on millimeter-wave bands present a significant challenge, considering
the necessity of constantly adjusting the beam directions. Conventional methods
are mostly based on classical control theory, e.g., Kalman filter and its
variations, which mainly deal with stationary scenarios. Therefore, severe
application limitations exist, especially with complicated, dynamic
Vehicle-to-Everything (V2X) channels. This paper gives a thorough study of this
subject, by first modifying the classical approaches, e.g., Extended Kalman
Filter (EKF) and Particle Filter (PF), for non-stationary scenarios, and then
proposing a Reinforcement Learning (RL)-based approach that can achieve the
URLLC requirements in a typical intersection scenario. Simulation results based
on a commercial ray-tracing simulator show that enhanced EKF and PF methods
achieve packet delay more than $10$ ms, whereas the proposed deep RL-based
method can reduce the latency to about $6$ ms, by extracting context
information from the training data.
- Abstract(参考訳): ミリ波帯の車両網におけるultra-reliable and low-latency communications (urllc) サービスは、ビーム方向を常に調整する必要があるため、大きな課題となっている。
従来の手法は主に古典的な制御理論、例えばカルマンフィルタとその変種に基づいており、主に定常シナリオを扱う。
したがって、特に複雑で動的なv2xチャネルでは、厳しいアプリケーション制限が存在する。
本稿では,従来の手法である拡張カルマンフィルタ (EKF) とパーティクルフィルタ (PF) を非定常シナリオに適用し,次に,典型的な交叉シナリオにおけるURLLC要求を実現するための強化学習 (RL) に基づくアプローチを提案する。
商用光線トレーシングシミュレータによるシミュレーション結果から,EKF法とPF法が拡張されてパケット遅延が10$ms以上になるのに対し,提案手法はトレーニングデータからコンテキスト情報を抽出することにより,遅延時間を約6$msに短縮する。
関連論文リスト
- Communication-Efficient Orchestrations for URLLC Service via
Hierarchical Reinforcement Learning [14.604814002402588]
制御ループの時間スケールが異なるマルチレベルポリシーの実装を可能にするマルチエージェント階層型RL(HRL)フレームワークを提案する。
従来技術のユースケースでは、HRLフレームワークを用いて、産業機器の最大送電量と送電電力を最適化した。
論文 参考訳(メタデータ) (2023-07-25T11:23:38Z) - Federated Deep Reinforcement Learning for THz-Beam Search with Limited
CSI [17.602598143822913]
超広帯域でのテラヘルツ(THz)通信は次世代無線ネットワークにおける高データレートの厳密な要求を実現するための有望な技術である。
THz信号の激しい伝搬減衰を効果的に克服するために、大規模なアンテナアレイのビーム方向を見つけることは、迫力のあるニーズである。
本稿では,複数の基地局のTHzビーム探索を高速に行うためのFDRL(Federated Deep reinforcement Learning)を提案する。
論文 参考訳(メタデータ) (2023-04-25T19:28:15Z) - Lyapunov Function Consistent Adaptive Network Signal Control with Back
Pressure and Reinforcement Learning [9.797994846439527]
本研究では、それぞれ特定のリャプノフ関数を定義するリアプノフ制御理論を用いた統一的なフレームワークを提案する。
Lyapunov理論の知見に基づいて、この研究は強化学習(Reinforcement Learning, RL)に基づくネットワーク信号制御のための報酬関数を設計する。
提案アルゴリズムは, 純旅客車流および貨物を含む異種交通流下での従来のRL法およびRL法と比較した。
論文 参考訳(メタデータ) (2022-10-06T00:22:02Z) - Model-based Deep Learning Receiver Design for Rate-Splitting Multiple
Access [65.21117658030235]
本研究では,モデルベース深層学習(MBDL)に基づく実用的なRSMA受信機の設計を提案する。
MBDL受信機は、符号なしシンボル誤り率(SER)、リンクレベルシミュレーション(LLS)によるスループット性能、平均トレーニングオーバーヘッドの観点から評価される。
その結果,MBDLはCSIRが不完全なSIC受信機よりも優れていた。
論文 参考訳(メタデータ) (2022-05-02T12:23:55Z) - Deep Reinforcement Learning for Resource Constrained Multiclass
Scheduling in Wireless Networks [0.0]
セットアップでは、ランダムに到着するサービス要求に対応するために、利用可能な限られた帯域幅のリソースを割り当てます。
本稿では,Deep Setsと組み合わせた分布型Deep Deterministic Policy Gradient (DDPG)アルゴリズムを提案する。
提案アルゴリズムは, 合成データと実データの両方で検証し, 従来手法に対する一貫した利得を示す。
論文 参考訳(メタデータ) (2020-11-27T09:49:38Z) - Meta-Reinforcement Learning for Trajectory Design in Wireless UAV
Networks [151.65541208130995]
ドローン基地局(DBS)は、要求が動的で予測不可能な地上ユーザーへのアップリンク接続を提供するために派遣される。
この場合、DBSの軌道は動的ユーザアクセス要求を満たすように適応的に調整されなければならない。
新たな環境に遭遇したDBSの軌道に適応するために,メタラーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-25T20:43:59Z) - Optimization-driven Deep Reinforcement Learning for Robust Beamforming
in IRS-assisted Wireless Communications [54.610318402371185]
Intelligent Reflecting Surface (IRS)は、マルチアンテナアクセスポイント(AP)から受信機へのダウンリンク情報伝達を支援する有望な技術である。
我々は、APのアクティブビームフォーミングとIRSのパッシブビームフォーミングを共同最適化することで、APの送信電力を最小化する。
過去の経験からビームフォーミング戦略に適応できる深層強化学習(DRL)手法を提案する。
論文 参考訳(メタデータ) (2020-05-25T01:42:55Z) - Dependency Aware Filter Pruning [74.69495455411987]
重要でないフィルタを割ることは、推論コストを軽減するための効率的な方法である。
以前の作業は、その重み基準やそれに対応するバッチノームスケーリング要因に従ってフィルタをプルークする。
所望の空間性を達成するために,空間性誘導正規化を動的に制御する機構を提案する。
論文 参考訳(メタデータ) (2020-05-06T07:41:22Z) - Millimeter Wave Communications with an Intelligent Reflector:
Performance Optimization and Distributional Reinforcement Learning [119.97450366894718]
ミリ波基地局のダウンリンクマルチユーザ通信を最適化するための新しいフレームワークを提案する。
チャネル状態情報(CSI)をリアルタイムで計測するために,チャネル推定手法を開発した。
最適赤外反射を学習し、ダウンリンク能力の期待を最大化するために、分布強化学習(DRL)手法を提案する。
論文 参考訳(メタデータ) (2020-02-24T22:18:54Z) - A Machine Learning Solution for Beam Tracking in mmWave Systems [33.1010771477611]
現実シナリオにおける特定の経路に対する到着角(AoA)を追跡するための機械学習ベースのアプローチを探索する。
本稿では,ネットワークを逐次データでトレーニングする手法を提案し,提案手法の性能を拡張Kalmanフィルタ法と比較した。
論文 参考訳(メタデータ) (2019-12-29T06:18:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。