論文の概要: Deep Reinforcement Learning-Based Beam Tracking for Low-Latency Services
in Vehicular Networks
- arxiv url: http://arxiv.org/abs/2002.05564v1
- Date: Thu, 13 Feb 2020 15:21:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-01 13:57:45.643334
- Title: Deep Reinforcement Learning-Based Beam Tracking for Low-Latency Services
in Vehicular Networks
- Title(参考訳): 深部強化学習に基づく低レイテンシネットワーク用ビームトラッキング
- Authors: Yan Liu, Zhiyuan Jiang, Shunqing Zhang, Shugong Xu
- Abstract要約: ミリ波帯の車両ネットワークにおける超信頼性・低レイテンシ通信(URLLC)は大きな課題である。
本稿では,まず,拡張カルマンフィルタ (EKF) や粒子フィルタ (PF) などの古典的手法を改良した。
次に、典型的な交差点シナリオにおいて、URLLC要求を達成することができる強化学習(RL)ベースのアプローチを提案する。
- 参考スコア(独自算出の注目度): 39.407929561526906
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Ultra-Reliable and Low-Latency Communications (URLLC) services in vehicular
networks on millimeter-wave bands present a significant challenge, considering
the necessity of constantly adjusting the beam directions. Conventional methods
are mostly based on classical control theory, e.g., Kalman filter and its
variations, which mainly deal with stationary scenarios. Therefore, severe
application limitations exist, especially with complicated, dynamic
Vehicle-to-Everything (V2X) channels. This paper gives a thorough study of this
subject, by first modifying the classical approaches, e.g., Extended Kalman
Filter (EKF) and Particle Filter (PF), for non-stationary scenarios, and then
proposing a Reinforcement Learning (RL)-based approach that can achieve the
URLLC requirements in a typical intersection scenario. Simulation results based
on a commercial ray-tracing simulator show that enhanced EKF and PF methods
achieve packet delay more than $10$ ms, whereas the proposed deep RL-based
method can reduce the latency to about $6$ ms, by extracting context
information from the training data.
- Abstract(参考訳): ミリ波帯の車両網におけるultra-reliable and low-latency communications (urllc) サービスは、ビーム方向を常に調整する必要があるため、大きな課題となっている。
従来の手法は主に古典的な制御理論、例えばカルマンフィルタとその変種に基づいており、主に定常シナリオを扱う。
したがって、特に複雑で動的なv2xチャネルでは、厳しいアプリケーション制限が存在する。
本稿では,従来の手法である拡張カルマンフィルタ (EKF) とパーティクルフィルタ (PF) を非定常シナリオに適用し,次に,典型的な交叉シナリオにおけるURLLC要求を実現するための強化学習 (RL) に基づくアプローチを提案する。
商用光線トレーシングシミュレータによるシミュレーション結果から,EKF法とPF法が拡張されてパケット遅延が10$ms以上になるのに対し,提案手法はトレーニングデータからコンテキスト情報を抽出することにより,遅延時間を約6$msに短縮する。
関連論文リスト
- SimBa: Simplicity Bias for Scaling Up Parameters in Deep Reinforcement Learning [49.83621156017321]
SimBaは、単純さのバイアスを注入することによって、深いRLでパラメータをスケールアップするように設計されたアーキテクチャである。
SimBaでパラメータをスケールアップすることで、オフポリシー、オンポリシー、アン教師なしメソッドを含む様々なディープRLアルゴリズムのサンプル効率が一貫して改善される。
論文 参考訳(メタデータ) (2024-10-13T07:20:53Z) - Event-Triggered Reinforcement Learning Based Joint Resource Allocation for Ultra-Reliable Low-Latency V2X Communications [10.914558012458425]
6G対応車載ネットワークは、安全クリティカルな情報をタイムリーに提供するための低遅延通信(URLLC)を確保するという課題に直面している。
車両間通信システム(V2X)の従来のリソース割り当てスキームは、従来の復号法に基づくアルゴリズムに依存している。
論文 参考訳(メタデータ) (2024-07-18T23:55:07Z) - Closed-form congestion control via deep symbolic regression [1.5961908901525192]
強化学習(RL)アルゴリズムは、超低レイテンシおよび高スループットシナリオにおける課題を処理することができる。
実際のデプロイメントにおけるニューラルネットワークモデルの採用は、リアルタイムの推論と解釈可能性に関して、依然としていくつかの課題を提起している。
本稿では,性能と一般化能力を維持しつつ,このような課題に対処する方法論を提案する。
論文 参考訳(メタデータ) (2024-03-28T14:31:37Z) - Iterative Preference Learning from Human Feedback: Bridging Theory and Practice for RLHF under KL-Constraint [56.74058752955209]
本稿では,RLHFによる強化学習を用いた生成モデルのアライメント過程について検討する。
まず、オフラインPPOやオフラインDPOのような既存の一般的な手法の主な課題を、環境の戦略的探索に欠如していると認識する。
有限サンプル理論保証を用いた効率的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-18T18:58:42Z) - Communication-Efficient Orchestrations for URLLC Service via
Hierarchical Reinforcement Learning [14.604814002402588]
制御ループの時間スケールが異なるマルチレベルポリシーの実装を可能にするマルチエージェント階層型RL(HRL)フレームワークを提案する。
従来技術のユースケースでは、HRLフレームワークを用いて、産業機器の最大送電量と送電電力を最適化した。
論文 参考訳(メタデータ) (2023-07-25T11:23:38Z) - Federated Deep Reinforcement Learning for THz-Beam Search with Limited
CSI [17.602598143822913]
超広帯域でのテラヘルツ(THz)通信は次世代無線ネットワークにおける高データレートの厳密な要求を実現するための有望な技術である。
THz信号の激しい伝搬減衰を効果的に克服するために、大規模なアンテナアレイのビーム方向を見つけることは、迫力のあるニーズである。
本稿では,複数の基地局のTHzビーム探索を高速に行うためのFDRL(Federated Deep reinforcement Learning)を提案する。
論文 参考訳(メタデータ) (2023-04-25T19:28:15Z) - Model-based Deep Learning Receiver Design for Rate-Splitting Multiple
Access [65.21117658030235]
本研究では,モデルベース深層学習(MBDL)に基づく実用的なRSMA受信機の設計を提案する。
MBDL受信機は、符号なしシンボル誤り率(SER)、リンクレベルシミュレーション(LLS)によるスループット性能、平均トレーニングオーバーヘッドの観点から評価される。
その結果,MBDLはCSIRが不完全なSIC受信機よりも優れていた。
論文 参考訳(メタデータ) (2022-05-02T12:23:55Z) - Optimization-driven Deep Reinforcement Learning for Robust Beamforming
in IRS-assisted Wireless Communications [54.610318402371185]
Intelligent Reflecting Surface (IRS)は、マルチアンテナアクセスポイント(AP)から受信機へのダウンリンク情報伝達を支援する有望な技術である。
我々は、APのアクティブビームフォーミングとIRSのパッシブビームフォーミングを共同最適化することで、APの送信電力を最小化する。
過去の経験からビームフォーミング戦略に適応できる深層強化学習(DRL)手法を提案する。
論文 参考訳(メタデータ) (2020-05-25T01:42:55Z) - Dependency Aware Filter Pruning [74.69495455411987]
重要でないフィルタを割ることは、推論コストを軽減するための効率的な方法である。
以前の作業は、その重み基準やそれに対応するバッチノームスケーリング要因に従ってフィルタをプルークする。
所望の空間性を達成するために,空間性誘導正規化を動的に制御する機構を提案する。
論文 参考訳(メタデータ) (2020-05-06T07:41:22Z) - A Machine Learning Solution for Beam Tracking in mmWave Systems [33.1010771477611]
現実シナリオにおける特定の経路に対する到着角(AoA)を追跡するための機械学習ベースのアプローチを探索する。
本稿では,ネットワークを逐次データでトレーニングする手法を提案し,提案手法の性能を拡張Kalmanフィルタ法と比較した。
論文 参考訳(メタデータ) (2019-12-29T06:18:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。