Fugu-MT 論文翻訳(概要): Deep Reinforcement Learning-Based Beam Tracking for Low-Latency Services in Vehicular Networks

論文の概要: Deep Reinforcement Learning-Based Beam Tracking for Low-Latency Services in Vehicular Networks

arxiv url: http://arxiv.org/abs/2002.05564v1
Date: Thu, 13 Feb 2020 15:21:24 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-01 13:57:45.643334
Title: Deep Reinforcement Learning-Based Beam Tracking for Low-Latency Services in Vehicular Networks
Title（参考訳）: 深部強化学習に基づく低レイテンシネットワーク用ビームトラッキング
Authors: Yan Liu, Zhiyuan Jiang, Shunqing Zhang, Shugong Xu
Abstract要約: ミリ波帯の車両ネットワークにおける超信頼性・低レイテンシ通信(URLLC)は大きな課題である。本稿では,まず,拡張カルマンフィルタ (EKF) や粒子フィルタ (PF) などの古典的手法を改良した。次に、典型的な交差点シナリオにおいて、URLLC要求を達成することができる強化学習(RL)ベースのアプローチを提案する。
参考スコア（独自算出の注目度）: 39.407929561526906
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Ultra-Reliable and Low-Latency Communications (URLLC) services in vehicular networks on millimeter-wave bands present a significant challenge, considering the necessity of constantly adjusting the beam directions. Conventional methods are mostly based on classical control theory, e.g., Kalman filter and its variations, which mainly deal with stationary scenarios. Therefore, severe application limitations exist, especially with complicated, dynamic Vehicle-to-Everything (V2X) channels. This paper gives a thorough study of this subject, by first modifying the classical approaches, e.g., Extended Kalman Filter (EKF) and Particle Filter (PF), for non-stationary scenarios, and then proposing a Reinforcement Learning (RL)-based approach that can achieve the URLLC requirements in a typical intersection scenario. Simulation results based on a commercial ray-tracing simulator show that enhanced EKF and PF methods achieve packet delay more than $10$ ms, whereas the proposed deep RL-based method can reduce the latency to about $6$ ms, by extracting context information from the training data.
Abstract（参考訳）: ミリ波帯の車両網におけるultra-reliable and low-latency communications (urllc) サービスは、ビーム方向を常に調整する必要があるため、大きな課題となっている。従来の手法は主に古典的な制御理論、例えばカルマンフィルタとその変種に基づいており、主に定常シナリオを扱う。したがって、特に複雑で動的なv2xチャネルでは、厳しいアプリケーション制限が存在する。本稿では,従来の手法である拡張カルマンフィルタ (EKF) とパーティクルフィルタ (PF) を非定常シナリオに適用し,次に,典型的な交叉シナリオにおけるURLLC要求を実現するための強化学習 (RL) に基づくアプローチを提案する。商用光線トレーシングシミュレータによるシミュレーション結果から,EKF法とPF法が拡張されてパケット遅延が10$ms以上になるのに対し,提案手法はトレーニングデータからコンテキスト情報を抽出することにより,遅延時間を約6$msに短縮する。

関連論文リスト

Intelligent Optimization of Wireless Access Point Deployment for Communication-Based Train Control Systems Using Deep Reinforcement Learning [12.256904916760796]
都市鉄道システムは、通信ベースの列車制御(CBTC)システムにますます依存している。トンネル内のアクセスポイント(AP)の最適配置は、堅牢な無線通信に不可欠である。経験的モデルに基づく最適化アルゴリズムのような従来の手法は、過剰な測定要求によって妨げられている。
論文参考訳（メタデータ） (2025-09-29T14:07:44Z)
Fluid Antenna System-assisted Physical Layer Secret Key Generation [64.92952968689636]
本稿では,流体アンテナシステム(FAS)を動的無線環境に適用することにより,多元系基地局システムにおける物理層生成(PLKG)について検討する。本研究では,送信ビームフォーミングとポート選択を統合したPLKGモデルを提案する。本論文で導入したスライディングウィンドウベースポート選択法は,動的ポート選択により,より少ないチェーンで高いKGRを実現する。
論文参考訳（メタデータ） (2025-09-19T03:01:29Z)
Large Language Model-Empowered Decision Transformer for UAV-Enabled Data Collection [71.84636717632206]
空間分散デバイスからの信頼性とエネルギー効率のよいデータ収集のための無人航空機(UAV)は、IoT(Internet of Things)アプリケーションをサポートする上で大きな可能性を秘めている。有効なUAV制御ポリシーを学習するための共同言語モデル(LLM)を提案する。 LLM-CRDTは、現在の最先端DTアプローチよりも最大36.7%高いエネルギー効率を達成し、オンラインおよびオフラインメソッドのベンチマークより優れている。
論文参考訳（メタデータ） (2025-09-17T13:05:08Z)
Green Learning for STAR-RIS mmWave Systems with Implicit CSI [53.03358325565645]
再構成可能なインテリジェントサーフェス (STAR-RIS) 支援ミリ波放送システム (mmWave) を同時に送信し, 反射するグリーンラーニング (GL) ベースのプリコーディングフレームワークを提案する。本研究は,将来の6Gネットワークにおける環境持続可能性を重視し,複数のユーザが同一情報を共有し,スペクトル効率を向上し,冗長伝送と電力消費を低減させるシナリオに,トランスミッションフレームワークを採用する。
論文参考訳（メタデータ） (2025-09-08T15:56:06Z)
World Model-Based Learning for Long-Term Age of Information Minimization in Vehicular Networks [53.98633183204453]
本稿では,車載ネットワークにおけるパケット完全性認識情報(CAoI)の年齢を最小化するために,新しい世界モデルに基づく学習フレームワークを提案する。 mmWave V2X環境の動的モデルを共同で学習し、リンクスケジューリングの方法を学ぶための軌跡を想像するために使用する世界モデルフレームワークを提案する。特に、長期的な政策は環境相互作用の代わりに、異なる想像軌道で学習される。
論文参考訳（メタデータ） (2025-05-03T06:23:18Z)
Invariant Control Strategies for Active Flow Control using Graph Neural Networks [0.0]
グラフニューラルネットワーク(GNN)を,強化学習(RL)に基づくフロー制御のための有望なアーキテクチャとして導入する。 GNNは非構造三次元フローデータを処理し、カルト格子の制約なしに空間的関係を保存する。我々は,GNNに基づく制御ポリシが,改良された一般化特性の恩恵を受けながら,既存の手法に匹敵する性能を実現することを示す。
論文参考訳（メタデータ） (2025-03-28T09:33:40Z)
SimBa: Simplicity Bias for Scaling Up Parameters in Deep Reinforcement Learning [49.83621156017321]
SimBaは、単純さのバイアスを注入することによって、深いRLでパラメータをスケールアップするように設計されたアーキテクチャである。 SimBaでパラメータをスケールアップすることで、オフポリシー、オンポリシー、アン教師なしメソッドを含む様々なディープRLアルゴリズムのサンプル効率が一貫して改善される。
論文参考訳（メタデータ） (2024-10-13T07:20:53Z)
Event-Triggered Reinforcement Learning Based Joint Resource Allocation for Ultra-Reliable Low-Latency V2X Communications [10.914558012458425]
6G対応車載ネットワークは、安全クリティカルな情報をタイムリーに提供するための低遅延通信(URLLC)を確保するという課題に直面している。車両間通信システム(V2X)の従来のリソース割り当てスキームは、従来の復号法に基づくアルゴリズムに依存している。
論文参考訳（メタデータ） (2024-07-18T23:55:07Z)
Closed-form congestion control via deep symbolic regression [1.5961908901525192]
強化学習(RL)アルゴリズムは、超低レイテンシおよび高スループットシナリオにおける課題を処理することができる。実際のデプロイメントにおけるニューラルネットワークモデルの採用は、リアルタイムの推論と解釈可能性に関して、依然としていくつかの課題を提起している。本稿では,性能と一般化能力を維持しつつ,このような課題に対処する方法論を提案する。
論文参考訳（メタデータ） (2024-03-28T14:31:37Z)
Iterative Preference Learning from Human Feedback: Bridging Theory and Practice for RLHF under KL-Constraint [56.74058752955209]
本稿では,RLHFによる強化学習を用いた生成モデルのアライメント過程について検討する。まず、オフラインPPOやオフラインDPOのような既存の一般的な手法の主な課題を、環境の戦略的探索に欠如していると認識する。有限サンプル理論保証を用いた効率的なアルゴリズムを提案する。
論文参考訳（メタデータ） (2023-12-18T18:58:42Z)
Communication-Efficient Orchestrations for URLLC Service via Hierarchical Reinforcement Learning [14.604814002402588]
制御ループの時間スケールが異なるマルチレベルポリシーの実装を可能にするマルチエージェント階層型RL(HRL)フレームワークを提案する。従来技術のユースケースでは、HRLフレームワークを用いて、産業機器の最大送電量と送電電力を最適化した。
論文参考訳（メタデータ） (2023-07-25T11:23:38Z)
Federated Deep Reinforcement Learning for THz-Beam Search with Limited CSI [17.602598143822913]
超広帯域でのテラヘルツ(THz)通信は次世代無線ネットワークにおける高データレートの厳密な要求を実現するための有望な技術である。 THz信号の激しい伝搬減衰を効果的に克服するために、大規模なアンテナアレイのビーム方向を見つけることは、迫力のあるニーズである。本稿では,複数の基地局のTHzビーム探索を高速に行うためのFDRL(Federated Deep reinforcement Learning)を提案する。
論文参考訳（メタデータ） (2023-04-25T19:28:15Z)
Model-based Deep Learning Receiver Design for Rate-Splitting Multiple Access [65.21117658030235]
本研究では,モデルベース深層学習(MBDL)に基づく実用的なRSMA受信機の設計を提案する。 MBDL受信機は、符号なしシンボル誤り率(SER)、リンクレベルシミュレーション(LLS)によるスループット性能、平均トレーニングオーバーヘッドの観点から評価される。その結果,MBDLはCSIRが不完全なSIC受信機よりも優れていた。
論文参考訳（メタデータ） (2022-05-02T12:23:55Z)
Optimization-driven Deep Reinforcement Learning for Robust Beamforming in IRS-assisted Wireless Communications [54.610318402371185]
Intelligent Reflecting Surface (IRS)は、マルチアンテナアクセスポイント(AP)から受信機へのダウンリンク情報伝達を支援する有望な技術である。我々は、APのアクティブビームフォーミングとIRSのパッシブビームフォーミングを共同最適化することで、APの送信電力を最小化する。過去の経験からビームフォーミング戦略に適応できる深層強化学習(DRL)手法を提案する。
論文参考訳（メタデータ） (2020-05-25T01:42:55Z)
Dependency Aware Filter Pruning [74.69495455411987]
重要でないフィルタを割ることは、推論コストを軽減するための効率的な方法である。以前の作業は、その重み基準やそれに対応するバッチノームスケーリング要因に従ってフィルタをプルークする。所望の空間性を達成するために,空間性誘導正規化を動的に制御する機構を提案する。
論文参考訳（メタデータ） (2020-05-06T07:41:22Z)
A Machine Learning Solution for Beam Tracking in mmWave Systems [33.1010771477611]
現実シナリオにおける特定の経路に対する到着角(AoA)を追跡するための機械学習ベースのアプローチを探索する。本稿では,ネットワークを逐次データでトレーニングする手法を提案し,提案手法の性能を拡張Kalmanフィルタ法と比較した。
論文参考訳（メタデータ） (2019-12-29T06:18:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。