論文の概要: World Model-Based Learning for Long-Term Age of Information Minimization in Vehicular Networks
- arxiv url: http://arxiv.org/abs/2505.01712v1
- Date: Sat, 03 May 2025 06:23:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-06 18:49:35.240098
- Title: World Model-Based Learning for Long-Term Age of Information Minimization in Vehicular Networks
- Title(参考訳): World Model-based Learning for Long-Term Age of Information Minimization in Vehicular Networks (特集:情報ネットワーク)
- Authors: Lingyi Wang, Rashed Shelim, Walid Saad, Naren Ramakrishnan,
- Abstract要約: 本稿では,車載ネットワークにおけるパケット完全性認識情報(CAoI)の年齢を最小化するために,新しい世界モデルに基づく学習フレームワークを提案する。
mmWave V2X環境の動的モデルを共同で学習し、リンクスケジューリングの方法を学ぶための軌跡を想像するために使用する世界モデルフレームワークを提案する。
特に、長期的な政策は環境相互作用の代わりに、異なる想像軌道で学習される。
- 参考スコア(独自算出の注目度): 53.98633183204453
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Traditional reinforcement learning (RL)-based learning approaches for wireless networks rely on expensive trial-and-error mechanisms and real-time feedback based on extensive environment interactions, which leads to low data efficiency and short-sighted policies. These limitations become particularly problematic in complex, dynamic networks with high uncertainty and long-term planning requirements. To address these limitations, in this paper, a novel world model-based learning framework is proposed to minimize packet-completeness-aware age of information (CAoI) in a vehicular network. Particularly, a challenging representative scenario is considered pertaining to a millimeter-wave (mmWave) vehicle-to-everything (V2X) communication network, which is characterized by high mobility, frequent signal blockages, and extremely short coherence time. Then, a world model framework is proposed to jointly learn a dynamic model of the mmWave V2X environment and use it to imagine trajectories for learning how to perform link scheduling. In particular, the long-term policy is learned in differentiable imagined trajectories instead of environment interactions. Moreover, owing to its imagination abilities, the world model can jointly predict time-varying wireless data and optimize link scheduling in real-world wireless and V2X networks. Thus, during intervals without actual observations, the world model remains capable of making efficient decisions. Extensive experiments are performed on a realistic simulator based on Sionna that integrates physics-based end-to-end channel modeling, ray-tracing, and scene geometries with material properties. Simulation results show that the proposed world model achieves a significant improvement in data efficiency, and achieves 26% improvement and 16% improvement in CAoI, respectively, compared to the model-based RL (MBRL) method and the model-free RL (MFRL) method.
- Abstract(参考訳): 無線ネットワークに対する従来の強化学習(RL)ベースの学習アプローチは、高価な試行錯誤機構と、広範囲な環境相互作用に基づくリアルタイムフィードバックに依存しており、データ効率の低下と短所的なポリシーにつながっている。
これらの制限は、高い不確実性と長期計画要件を持つ複雑な動的ネットワークにおいて特に問題となる。
このような制約に対処するため,本研究では,車載ネットワークにおけるパケット完全性を考慮した情報化(CAoI)の最小化を目的とした,新しい世界モデルベース学習フレームワークを提案する。
特に、高モビリティ、頻繁な信号遮断、および極めて短いコヒーレンス時間で特徴付けられるミリ波車両間通信網(V2X)に関する、挑戦的な代表的シナリオが検討されている。
次に,mmWave V2X環境の動的モデルを共同で学習し,リンクスケジューリングの方法を学ぶための軌跡を想像するための世界モデルフレームワークを提案する。
特に、長期的な政策は環境相互作用の代わりに、異なる想像軌道で学習される。
さらに、その想像力により、ワールドモデルは、リアルタイム無線およびV2Xネットワークのリンクスケジューリングを最適化し、時変無線データを共同で予測することができる。
したがって、実際の観測のない間隔において、世界モデルは効率的な決定を下すことができる。
物理に基づくエンドツーエンドチャネルモデリング、レイトレーシング、シーンジオメトリを材料特性と統合したシオンナに基づく現実的なシミュレータ上で、大規模な実験を行う。
シミュレーションの結果,提案した世界モデルはデータ効率を大幅に向上し,モデルベースRL(MBRL)法とモデルフリーRL(MFRL)法と比較してCAoIが26%,CAoIが16%向上した。
関連論文リスト
- Accelerating Model-Based Reinforcement Learning with State-Space World Models [18.71404724458449]
強化学習(Reinforcement Learning, RL)は、ロボット学習における強力なアプローチである。
しかし、モデルフリーRL(MFRL)は、制御ポリシーをうまく学習するために、多数の環境相互作用を必要とする。
状態空間世界モデルを用いたモデルベースRLの高速化手法を提案する。
論文 参考訳(メタデータ) (2025-02-27T15:05:25Z) - Robotic World Model: A Neural Network Simulator for Robust Policy Optimization in Robotics [50.191655141020505]
この研究は、長期水平予測、エラー蓄積、およびsim-to-real転送の課題に対処することで、モデルに基づく強化学習を前進させる。
スケーラブルでロバストなフレームワークを提供することで、現実のアプリケーションにおいて適応的で効率的なロボットシステムを実現することができる。
論文 参考訳(メタデータ) (2025-01-17T10:39:09Z) - From Imitation to Exploration: End-to-end Autonomous Driving based on World Model [24.578178308010912]
RAMBLEは、意思決定を駆動するエンド・ツー・エンドの世界モデルベースのRL方式である。
複雑な動的トラフィックシナリオを処理できる。
CARLA Leaderboard 1.0では、ルート完了率の最先端のパフォーマンスを達成し、CARLA Leaderboard 2.0では38のシナリオをすべて完了している。
論文 参考訳(メタデータ) (2024-10-03T06:45:59Z) - Hybrid Transformer and Spatial-Temporal Self-Supervised Learning for
Long-term Traffic Prediction [1.8531577178922987]
本稿では,ハイブリッドトランスフォーマーと自己教師型学習を組み合わせたモデルを提案する。
このモデルは、トラフィックのシーケンスレベルにデータ拡張技術を適用することにより、適応的なデータ拡張を強化する。
本研究では,時間的および空間的依存をモデル化する2つの自己教師型学習タスクを設計し,モデルの精度と能力を向上させる。
論文 参考訳(メタデータ) (2024-01-29T06:17:23Z) - Attention-based Spatial-Temporal Graph Convolutional Recurrent Networks
for Traffic Forecasting [12.568905377581647]
交通予測は交通科学と人工知能における最も基本的な問題の一つである。
既存の手法では、長期的相関と短期的相関を同時にモデル化することはできない。
本稿では,GCRN(Graph Convolutional Recurrent Module)とグローバルアテンションモジュールからなる新しい時空間ニューラルネットワークフレームワークを提案する。
論文 参考訳(メタデータ) (2023-02-25T03:37:00Z) - Parallel Successive Learning for Dynamic Distributed Model Training over
Heterogeneous Wireless Networks [50.68446003616802]
フェデレートラーニング(Federated Learning, FedL)は、一連の無線デバイスにモデルトレーニングを配布する一般的なテクニックとして登場した。
我々は,FedLアーキテクチャを3次元に拡張した並列逐次学習(PSL)を開発した。
我々の分析は、分散機械学習におけるコールド対ウォームアップモデルの概念とモデル慣性について光を当てている。
論文 参考訳(メタデータ) (2022-02-07T05:11:01Z) - TSSRGCN: Temporal Spectral Spatial Retrieval Graph Convolutional Network
for Traffic Flow Forecasting [41.87633457352356]
本稿では,ネットワークのグローバル性と局所性に着目したニューラルネットワークモデルを提案する。
2つの実世界のデータセットの実験により、このモデルが交通データの空間的時間的相関を精査できることが示されている。
論文 参考訳(メタデータ) (2020-11-30T09:21:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。