論文の概要: Taming Vision Priors for Data Efficient mmWave Channel Modeling
- arxiv url: http://arxiv.org/abs/2603.13383v1
- Date: Wed, 11 Mar 2026 04:35:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 16:19:35.146757
- Title: Taming Vision Priors for Data Efficient mmWave Channel Modeling
- Title(参考訳): データ効率の良いミリ波チャネルモデリングのためのモデリングビジョン先行
- Authors: Zhenlin An, Longfei Shangguan, John Kaewell, Philip Pietraski, Jelena Senic, Camillo Gentile, Nada Golmie, Kyle Jamieson,
- Abstract要約: 微分可能なレイトレーシングは、ミリ波伝搬(mmWave)をモデル化するための物理地上ソリューションを提供する。
微分可能な光線トレーシングは物理地上のソリューションを提供するが、網羅的なチャネル測定への過度な依存のため、まだ展開上の課題に直面している。
我々は、視覚由来の素材と異なる光線トレーシングを統合する、スケーラブルでデータ効率のよいデジタルツインフレームワークであるVisRFTwinを提案する。
- 参考スコア(独自算出の注目度): 17.020987773588907
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Accurately modeling millimeter-wave (mmWave) propagation is essential for real-time AR and autonomous systems. Differentiable ray tracing offers a physics-grounded solution but still facing deployment challenges due to its over-reliance on exhaustive channel measurements or brittle, hand-tuned scene models for material properties. We present VisRFTwin, a scalable and data-efficient digital-twin framework that integrates vision-derived material priors with differentiable ray tracing. Multi-view images from commodity cameras are processed by a frozen Vision-Language Model to extract dense semantic embeddings, which are translated into initial estimates of permittivity and conductivity for scene surfaces. These priors initialize a Sionna-based differentiable ray tracer, which rapidly calibrates material parameters via gradient descent with only a few dozen sparse channel soundings. Once calibrated, the association between vision features and material parameters is retained, enabling fast transfer to new scenarios without repeated calibration. Evaluations across three real-world scenarios, including office interiors, urban canyons, and dynamic public spaces show that VisRFTwin reduces channel measurement needs by up to 10$\times$ while achieving a 59% lower median delay spread error than pure data-driven deep learning methods.
- Abstract(参考訳): リアルタイムARや自律システムには,ミリ波伝搬の正確なモデル化が不可欠である。
微分可能な光線トレーシングは、物理地上のソリューションを提供するが、網羅的なチャネルの測定や、手動で調整された材料特性のシーンモデルへの過度な依存のために、まだ展開上の課題に直面している。
我々は、視覚由来の素材と異なる光線トレーシングを統合する、スケーラブルでデータ効率のよいデジタルツインフレームワークであるVisRFTwinを提案する。
商品カメラからのマルチビュー画像は、凍結したビジョンランゲージモデルにより処理され、密密なセマンティック埋め込みを抽出し、シーン表面の誘電率と導電率の初期推定に変換する。
これらの先行は、シオンナをベースとした微分可能光線トレーサを初期化し、わずか数十個のスパースチャネルの発振で、勾配降下によって物質パラメータを素早く校正する。
一度校正すると、視覚特徴と物質パラメータの関係が保たれ、繰り返し校正せずに新しいシナリオに素早く移行できる。
オフィスインテリア、都市キャニオン、ダイナミックな公共空間など、現実世界の3つのシナリオでの評価によると、VisRFTwinは、純粋なデータ駆動ディープラーニング手法よりも59%低い中央値遅延スプレッドエラーを達成しつつ、チャネル計測のニーズを最大10$\times$に削減している。
関連論文リスト
- Event-based Visual Deformation Measurement [76.25283405575108]
視覚的変形測定は、カメラ観測から表面の動きを追跡することによって、高密度な変形場を復元することを目的としている。
従来の画像ベースの手法は、対応検索空間を制限するため、最小限のフレーム間動作に依存している。
本研究では,時間的に密集した動きキューやフレームのイベントを利用して,空間的に密集した正確な推定を行うイベントフレーム融合フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-16T01:04:48Z) - Vision-Language-Model-Guided Differentiable Ray Tracing for Fast and Accurate Multi-Material RF Parameter Estimation [45.40179208702883]
本稿では,マルチマテリアルパラメータ推定を高速化し,安定化する視覚言語モデル(VLM)のフレームワークを提案する。
NVIDIA Sionnaの屋内シーンの実験では、2-4$times$高速収束、10-100$times$低い最終パラメータエラーが示されている。
論文 参考訳(メタデータ) (2026-01-26T07:54:53Z) - EvDiff: High Quality Video with an Event Camera [77.07279880903009]
イベントからの強度画像の再構成は、絶対的な明るさのあいまいさが原因で、非常に不適切な作業である。
EvDiffはイベントベースの拡散モデルであり、高品質なビデオを作成するための代理トレーニングフレームワークに従う。
論文 参考訳(メタデータ) (2025-11-21T18:49:18Z) - Taming generative video models for zero-shot optical flow extraction [28.176290134216995]
将来のフレーム予測のためにのみ訓練された自己教師付きビデオモデルは、微調整なしで、出力フローを誘導することができる。
対実世界モデル(CWM)パラダイムに触発されて、我々はこのアイデアを生成型ビデオモデルに拡張する。
KLトラシング(KL-tracing)は、局所摂動を第1フレームに注入し、モデルを第1ステップでロールアウトし、摂動分布と非退化予測分布の間のクルバック・リーブラー分岐を計算する、新しいテストタイムプロシージャである。
論文 参考訳(メタデータ) (2025-07-11T23:59:38Z) - Resource-Efficient Beam Prediction in mmWave Communications with Multimodal Realistic Simulation Framework [57.994965436344195]
ビームフォーミングは、方向と強度を最適化して信号伝送を改善するミリ波通信において重要な技術である。
マルチモーダルセンシング支援ビーム予測は,ユーザ位置やネットワーク条件を予測するために,さまざまなセンサデータを使用して注目されている。
その有望な可能性にもかかわらず、マルチモーダルセンシング支援ビーム予測の採用は、高い計算複雑性、高いコスト、限られたデータセットによって妨げられている。
論文 参考訳(メタデータ) (2025-04-07T15:38:25Z) - EvLight++: Low-Light Video Enhancement with an Event Camera: A Large-Scale Real-World Dataset, Novel Method, and More [7.974102031202597]
EvLight++は、現実のシナリオで堅牢なパフォーマンスのために設計された、イベント誘導型低照度ビデオ拡張アプローチである。
EvLight++は1.37dBと3.71dBの2つのイメージベースとビデオベースの両方で大幅に性能が向上した。
論文 参考訳(メタデータ) (2024-08-29T04:30:31Z) - Learning Radio Environments by Differentiable Ray Tracing [56.40113938833999]
本稿では, 材料特性, 散乱, アンテナパターンの微分パラメトリゼーションによって補う, 勾配式キャリブレーション法を提案する。
提案手法は,MIMO(分散マルチインプットマルチインプット・マルチアウトプット・チャネル・サウンドア)を用いて,合成データと実世界の屋内チャネル計測の両方を用いて検証した。
論文 参考訳(メタデータ) (2023-11-30T13:50:21Z) - Differentiable Radio Frequency Ray Tracing for Millimeter-Wave Sensing [29.352303349003165]
我々はmmWaveベースの3D再構成のための微分可能なフレームワークDiffSBRを提案する。
DiffSBRは、仮想3Dモデルからレーダーポイント雲をシミュレートするために、微分可能なレイトレーシングエンジンを組み込んでいる。
各種レーダーハードウェアを用いた実験は、ディフSBRの微細な3D再構成能力を検証する。
論文 参考訳(メタデータ) (2023-11-22T06:13:39Z) - A Generative Learning Approach for Spatio-temporal Modeling in Connected
Vehicular Network [55.852401381113786]
本稿では,コネクテッドカーの無線アクセス遅延を実現するための総合的時間品質フレームワークであるLaMI(Latency Model Inpainting)を提案する。
LaMIはイメージインペイントと合成のアイデアを採用し、2段階の手順で欠落したレイテンシサンプルを再構築することができる。
特に、パッチ方式のアプローチを用いて各地域で収集されたサンプル間の空間的相関を初めて発見し、その後、原点および高度に相関したサンプルをバラエナオートコーダ(VAE)に供給する。
論文 参考訳(メタデータ) (2020-03-16T03:43:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。