Fugu-MT 論文翻訳(概要): Environment-Aware Channel Prediction for Vehicular Communications: A Multimodal Visual Feature Fusion Framework

論文の概要: Environment-Aware Channel Prediction for Vehicular Communications: A Multimodal Visual Feature Fusion Framework

arxiv url: http://arxiv.org/abs/2604.02396v1
Date: Thu, 02 Apr 2026 13:31:17 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-06 17:20:24.140777
Title: Environment-Aware Channel Prediction for Vehicular Communications: A Multimodal Visual Feature Fusion Framework
Title（参考訳）: 環境に配慮した車体通信チャネル予測:マルチモーダル視覚特徴融合フレームワーク
Authors: Xuejian Zhang, Ruisi He, Minseok Kim, Inocent Calist, Mi Yang, Ziyi Qi,
Abstract要約: 6G vehicular通信は、信頼性、レイテンシ、適応性要求の下で、正確で前方に見えるチャネル予測を必要とする。本稿では,マルチモーダル視覚特徴融合に基づく環境対応チャネル予測フレームワークを提案する。同期都市V2I測定データセットの実験では、PLが3.26dB、RMSEが37.66ns、5.05°、および5.08°の最高根平均二乗誤差(RMSE)が得られる。
参考スコア（独自算出の注目度）: 5.312960628870459
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The deep integration of communication with intelligence and sensing, as a defining vision of 6G, renders environment-aware channel prediction a key enabling technology. As a representative 6G application, vehicular communications require accurate and forward-looking channel prediction under stringent reliability, latency, and adaptability demands. Traditional empirical and deterministic models remain limited in balancing accuracy, generalization, and deployability, while the growing availability of onboard and roadside sensing devices offers a promising source of environmental priors. This paper proposes an environment-aware channel prediction framework based on multimodal visual feature fusion. Using GPS data and vehicle-side panoramic RGB images, together with semantic segmentation and depth estimation, the framework extracts semantic, depth, and position features through a three-branch architecture and performs adaptive multimodal fusion via a squeeze-excitation attention gating module. For 360-dimensional angular power spectrum (APS) prediction, a dedicated regression head and a composite multi-constraint loss are further designed. As a result, joint prediction of path loss (PL), delay spread (DS), azimuth spread of arrival (ASA), azimuth spread of departure (ASD), and APS is achieved. Experiments on a synchronized urban V2I measurement dataset yield the best root mean square error (RMSE) of 3.26 dB for PL, RMSEs of 37.66 ns, 5.05 degrees, and 5.08 degrees for DS, ASA, and ASD, respectively, and mean/median APS cosine similarities of 0.9342/0.9571, demonstrating strong accuracy, generalization, and practical potential for intelligent channel prediction in 6G vehicular communications.
Abstract（参考訳）: インテリジェンスとインテリジェンスとのコミュニケーションの深い統合は、6Gの明確なビジョンとして、環境に配慮したチャネル予測を重要な実現技術とする。代表的な6Gアプリケーションとして、車両通信は、厳密な信頼性、レイテンシ、適応性要求の下で、正確で前方に見えるチャネル予測を必要とする。従来の経験的および決定論的モデルは、正確性、一般化、展開可能性のバランスに限られる一方で、オンボードや道路沿いのセンサー機器の可用性は、将来的な環境優先の源泉となっている。本稿では,マルチモーダル視覚特徴融合に基づく環境対応チャネル予測フレームワークを提案する。 GPSデータと車側パノラマRGB画像を用いてセマンティックセグメンテーションと深度推定を行い、3分岐アーキテクチャを通してセマンティック、深さ、位置特徴を抽出し、圧縮励起アテンションゲーティングモジュールを介して適応マルチモーダル融合を行う。 360-dimensional angular power spectrum (APS) 予測では、専用レグレッションヘッドと複合多拘束損失がさらに設計されている。その結果、経路損失(PL)、遅延拡散(DS)、到着の方位拡散(ASA)、出発の方位拡散(ASD)、APSが達成された。同期都市V2I測定データセットの実験では、PLが3.26dB、DSが37.66ns、5.05°、ASDが5.08°、SASが0.9342/0.9571の平均/中間APSコサイン類似性が0.9342/0.9571となり、6G車両通信におけるインテリジェントチャネル予測の可能性が示された。

関連論文リスト

Why Channel-Centric Models are not Enough to Predict End-to-End Performance in Private 5G: A Measurement Campaign and Case Study [0.0]
通信対応ロボット計画には,無線ネットワーク性能の正確な予測が必要である。現在のアプローチは、受信信号強度や信号対雑音比といったチャネルレベルの指標に依存している。我々は,民間の5G産業環境における計測キャンペーンを通じて,この仮定に挑戦する。
論文参考訳（メタデータ） (2026-03-09T19:27:00Z)
Wireless Traffic Prediction with Large Language Model [54.07581399989292]
TIDESは、無線トラフィック予測のための空間時間相関をキャプチャする新しいフレームワークである。 TIDESは過剰なトレーニングオーバーヘッドを発生させることなく、ドメイン固有のパターンへの効率的な適応を実現する。この結果から,将来の6Gシステムにおいて,空間認識をLCMベースの予測器に統合することが,スケーラブルでインテリジェントなネットワーク管理の鍵であることが示唆された。
論文参考訳（メタデータ） (2025-12-19T04:47:40Z)
Agentic World Modeling for 6G: Near-Real-Time Generative State-Space Reasoning [70.56067503630486]
第6世代(6G)インテリジェンスは、流動的なトークン予測ではなく、想像と選択の能力を校正している、と我々は主張する。 We showed that WM-MS3M cuts mean absolute error (MAE) by 1.69% vs MS3M with 32% less parameters and similar latency, and achieve a 35-80% lower root mean squared error (RMSE) than attention/hybrid baselines with 2.3-4.1x faster inference。
論文参考訳（メタデータ） (2025-11-04T17:22:22Z)
Vehicle-to-Infrastructure Collaborative Spatial Perception via Multimodal Large Language Models [41.00138090010061]
大型言語モデル (MLLM) の限界を克服するために, 軽量でプラグアンドプレイの鳥眼ビュー (BEV) インジェクションコネクタを提案する。レイトレーシングはRGB、LiDAR、GPS、無線信号データを様々なセンシングシナリオで生成するために開発された。シミュレーションの結果,提案したBEVインジェクションフレームワークは全タスクのパフォーマンスを継続的に改善していることがわかった。
論文参考訳（メタデータ） (2025-09-04T02:57:47Z)
Resource-Efficient Beam Prediction in mmWave Communications with Multimodal Realistic Simulation Framework [57.994965436344195]
ビームフォーミングは、方向と強度を最適化して信号伝送を改善するミリ波通信において重要な技術である。マルチモーダルセンシング支援ビーム予測は,ユーザ位置やネットワーク条件を予測するために,さまざまなセンサデータを使用して注目されている。その有望な可能性にもかかわらず、マルチモーダルセンシング支援ビーム予測の採用は、高い計算複雑性、高いコスト、限られたデータセットによって妨げられている。
論文参考訳（メタデータ） (2025-04-07T15:38:25Z)
MetaOcc: Spatio-Temporal Fusion of Surround-View 4D Radar and Camera for 3D Occupancy Prediction with Dual Training Strategies [12.485905108032146]
本稿では,Omni指向の3次元占有予測のための新しいマルチモーダルフレームワークであるMetaOccを紹介する。レーダーデータにエンコーダを直接適用することの限界に対処するため,レーダハイト自己保持モジュールを提案する。高価な点クラウドへの依存を軽減するため,オープンセットセグメンタに基づく擬似ラベル生成パイプラインを提案する。
論文参考訳（メタデータ） (2025-01-26T03:51:56Z)
ALOcc: Adaptive Lifting-Based 3D Semantic Occupancy and Cost Volume-Based Flow Predictions [91.55655961014027]
シーン理解には3次元セマンティック占有とフロー予測が不可欠である。本稿では,3つの改善点を目標とした視覚ベースのフレームワークを提案する。我々の純粋な畳み込みアーキテクチャは、セマンティック占有率とジョイントセマンティックフロー予測の両方のために、複数のベンチマーク上で新しいSOTA性能を確立する。
論文参考訳（メタデータ） (2024-11-12T11:32:56Z)
OPUS: Occupancy Prediction Using a Sparse Set [64.60854562502523]
学習可能なクエリの集合を用いて、占有された場所とクラスを同時に予測するフレームワークを提案する。 OPUSには、モデルパフォーマンスを高めるための非自明な戦略が組み込まれている。最も軽量なモデルではOcc3D-nuScenesデータセットの2倍 FPS に優れたRayIoUが得られる一方、最も重いモデルは6.1 RayIoUを上回ります。
論文参考訳（メタデータ） (2024-09-14T07:44:22Z)
ViT LoS V2X: Vision Transformers for Environment-aware LoS Blockage Prediction for 6G Vehicular Networks [20.953587995374168]
我々は、畳み込みニューラルネットワーク(CNN)とカスタマイズされた視覚変換器(ViT)を組み合わせたディープラーニングベースのアプローチを提案する。提案手法は,時系列マルチモーダルデータから特徴を抽出するために,CNNとViTの相乗的強みを利用する。その結果,提案手法は精度が高く,最先端のソリューションよりも優れ,95%以上の精度で予測できることがわかった。
論文参考訳（メタデータ） (2024-06-27T01:38:09Z)
Joint Sensing, Communication, and AI: A Trifecta for Resilient THz User Experiences [118.91584633024907]
テラヘルツ(THz)無線システムに対する拡張現実(XR)体験を最適化するために、新しい共同センシング、通信、人工知能(AI)フレームワークを提案する。
論文参考訳（メタデータ） (2023-04-29T00:39:50Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。