論文の概要: Dual-Mind World Models: A General Framework for Learning in Dynamic Wireless Networks
- arxiv url: http://arxiv.org/abs/2510.24546v1
- Date: Tue, 28 Oct 2025 15:45:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-29 15:35:37.259573
- Title: Dual-Mind World Models: A General Framework for Learning in Dynamic Wireless Networks
- Title(参考訳): Dual-Mind World Models: 動的無線ネットワークにおける学習のための汎用フレームワーク
- Authors: Lingyi Wang, Rashed Shelim, Walid Saad, Naren Ramakrishnan,
- Abstract要約: 本稿では,mmWave V2Xネットワークのための新しい2次元世界モデルベース学習フレームワークを提案する。
認知心理学に触発されて提案されたデュアルミンド世界モデルは、パターン駆動型システム1コンポーネントと論理駆動型システム2コンポーネントを含んでいる。
シミュレーションの結果,提案した世界モデルはデータ効率を大幅に向上することがわかった。
- 参考スコア(独自算出の注目度): 43.39205414684229
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite the popularity of reinforcement learning (RL) in wireless networks, existing approaches that rely on model-free RL (MFRL) and model-based RL (MBRL) are data inefficient and short-sighted. Such RL-based solutions cannot generalize to novel network states since they capture only statistical patterns rather than the underlying physics and logic from wireless data. These limitations become particularly challenging in complex wireless networks with high dynamics and long-term planning requirements. To address these limitations, in this paper, a novel dual-mind world model-based learning framework is proposed with the goal of optimizing completeness-weighted age of information (CAoI) in a challenging mmWave V2X scenario. Inspired by cognitive psychology, the proposed dual-mind world model encompasses a pattern-driven System 1 component and a logic-driven System 2 component to learn dynamics and logic of the wireless network, and to provide long-term link scheduling over reliable imagined trajectories. Link scheduling is learned through end-to-end differentiable imagined trajectories with logical consistency over an extended horizon rather than relying on wireless data obtained from environment interactions. Moreover, through imagination rollouts, the proposed world model can jointly reason network states and plan link scheduling. During intervals without observations, the proposed method remains capable of making efficient decisions. Extensive experiments are conducted on a realistic simulator based on Sionna with real-world physical channel, ray-tracing, and scene objects with material properties. Simulation results show that the proposed world model achieves a significant improvement in data efficiency and achieves strong generalization and adaptation to unseen environments, compared to the state-of-the-art RL baselines, and the world model approach with only System 1.
- Abstract(参考訳): 無線ネットワークにおける強化学習(RL)の人気にもかかわらず、モデルフリーRL(MFRL)とモデルベースRL(MBRL)に依存する既存のアプローチは、データ非効率で近視的である。
このようなRLベースのソリューションは、無線データから基礎となる物理や論理よりも統計的パターンのみを捉えるため、新しいネットワーク状態に一般化することはできない。
これらの制限は、高ダイナミック性と長期計画要求のある複雑な無線ネットワークでは特に困難になる。
これらの制約に対処するため,本論文では,完全性重み付き情報時代(CAoI)を挑戦的なmmWave V2Xシナリオで最適化することを目的として,新しい2次元世界モデルベース学習フレームワークを提案する。
認知心理学に触発されて、提案されたデュアルミンド世界モデルは、パターン駆動型システム1コンポーネントと論理駆動型システム2コンポーネントを含み、無線ネットワークのダイナミクスとロジックを学習し、信頼性の高い仮想軌道上での長期リンクスケジューリングを提供する。
リンクスケジューリングは、環境相互作用から得られた無線データに頼るのではなく、拡張地平線上で論理的一貫性を持つエンドツーエンドの微分可能軌道を通して学習される。
さらに、想像力のロールアウトにより、提案した世界モデルは、ネットワーク状態とプランリンクスケジューリングを共同で推論することができる。
観測のない間隔で、提案手法は効率的な決定を行うことができる。
実世界の物理チャネルを持つシオンナ, レイトレーシング, 物質特性を持つシーンオブジェクトを用いた現実的なシミュレーション実験を行った。
シミュレーションの結果,提案した世界モデルは,現状のRLベースラインやシステム1のみを用いた世界モデルアプローチと比較して,データ効率の大幅な向上と,見えない環境への強力な一般化と適応を実現していることがわかった。
関連論文リスト
- World Models for Cognitive Agents: Transforming Edge Intelligence in Future Networks [55.90051810762702]
本稿では,世界モデルを概観し,そのアーキテクチャ,トレーニングパラダイム,予測,生成,計画,因果推論といった応用を概観する。
ワイヤレスエッジインテリジェンス最適化に適した,新しい世界モデルに基づく強化学習フレームワークであるWireless Dreamerを提案する。
論文 参考訳(メタデータ) (2025-05-31T06:43:00Z) - World Model-Based Learning for Long-Term Age of Information Minimization in Vehicular Networks [53.98633183204453]
本稿では,車載ネットワークにおけるパケット完全性認識情報(CAoI)の年齢を最小化するために,新しい世界モデルに基づく学習フレームワークを提案する。
mmWave V2X環境の動的モデルを共同で学習し、リンクスケジューリングの方法を学ぶための軌跡を想像するために使用する世界モデルフレームワークを提案する。
特に、長期的な政策は環境相互作用の代わりに、異なる想像軌道で学習される。
論文 参考訳(メタデータ) (2025-05-03T06:23:18Z) - DMWM: Dual-Mind World Model with Long-Term Imagination [43.39205414684229]
本稿では、論理的推論を統合し、論理的一貫性で想像力を発揮できる新しいデュアルミンド世界モデル(DMWM)を提案する。
提案するフレームワークは,DMControlスイートからの長期計画を必要とするベンチマークタスクに基づいて評価される。
論文 参考訳(メタデータ) (2025-02-11T14:40:57Z) - Digital Twin-Enhanced Wireless Indoor Navigation: Achieving Efficient Environment Sensing with Zero-Shot Reinforcement Learning [21.79206567364126]
ミリ波通信は将来のモバイルネットワークにおいて重要な要素であり、複雑な環境での屋内ナビゲーションに最適である。
従来の物理学に基づく手法、例えば到着角(AoA)は複雑なシナリオでは不足することが多い。
本稿では,デジタル双生児が提供する身体的洞察を利用して,強化学習(RL)報酬関数を形作る物理情報強化学習(PIRL)手法を提案する。
論文 参考訳(メタデータ) (2023-06-11T20:33:22Z) - Optimization-driven Machine Learning for Intelligent Reflecting Surfaces
Assisted Wireless Networks [82.33619654835348]
インテリジェントサーフェス(IRS)は、個々の散乱素子の位相シフトを制御して無線チャネルを再形成するために用いられる。
散乱素子の規模が大きいため、受動ビームフォーミングは一般に高い計算複雑性によって挑戦される。
本稿では、IRS支援無線ネットワークの性能向上のための機械学習(ML)アプローチに焦点を当てる。
論文 参考訳(メタデータ) (2020-08-29T08:39:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。