論文の概要: Vision-Language-Model-Guided Differentiable Ray Tracing for Fast and Accurate Multi-Material RF Parameter Estimation
- arxiv url: http://arxiv.org/abs/2601.18242v1
- Date: Mon, 26 Jan 2026 07:54:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:08.727721
- Title: Vision-Language-Model-Guided Differentiable Ray Tracing for Fast and Accurate Multi-Material RF Parameter Estimation
- Title(参考訳): 高速かつ高精度な多磁束RFパラメータ推定のためのビジョンランゲージモデル誘導微分可能レイトレーシング
- Authors: Zerui Kang, Yishen Lim, Zhouyou Gu, Seung-Woo Ko, Tony Q. S. Quek, Jihong Park,
- Abstract要約: 本稿では,マルチマテリアルパラメータ推定を高速化し,安定化する視覚言語モデル(VLM)のフレームワークを提案する。
NVIDIA Sionnaの屋内シーンの実験では、2-4$times$高速収束、10-100$times$低い最終パラメータエラーが示されている。
- 参考スコア(独自算出の注目度): 45.40179208702883
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate radio-frequency (RF) material parameters are essential for electromagnetic digital twins in 6G systems, yet gradient-based inverse ray tracing (RT) remains sensitive to initialization and costly under limited measurements. This paper proposes a vision-language-model (VLM) guided framework that accelerates and stabilizes multi-material parameter estimation in a differentiable RT (DRT) engine. A VLM parses scene images to infer material categories and maps them to quantitative priors via an ITU-R material table, yielding informed conductivity initializations. The VLM further selects informative transmitter/receiver placements that promote diverse, material-discriminative paths. Starting from these priors, the DRT performs gradient-based refinement using measured received signal strengths. Experiments in NVIDIA Sionna on indoor scenes show 2-4$\times$ faster convergence and 10-100$\times$ lower final parameter error compared with uniform or random initialization and random placement baselines, achieving sub-0.1\% mean relative error with only a few receivers. Complexity analyses indicate per-iteration time scales near-linearly with the number of materials and measurement setups, while VLM-guided placement reduces the measurements required for accurate recovery. Ablations over RT depth and ray counts confirm further accuracy gains without significant per-iteration overhead. Results demonstrate that semantic priors from VLMs effectively guide physics-based optimization for fast and reliable RF material estimation.
- Abstract(参考訳): 6G系における電磁デジタル双極子には正確な電波周波数(RF)材料パラメータが不可欠であるが、勾配に基づく逆レイトレーシング(RT)は初期化に敏感であり、限られた測定条件下では高価である。
本稿では、微分可能RT(DRT)エンジンにおける多物質パラメータ推定を高速化し、安定化する視覚言語モデル(VLM)ガイドフレームワークを提案する。
VLMはシーン画像を解析して材料カテゴリを推測し、それをITU-R材料テーブルを介して定量的に事前マップし、情報伝導率の初期化を生成する。
VLMはさらに、多種多様な物質識別経路を促進する情報発信者/受信者配置を選択する。
これらの先行情報から、DRTは測定された受信信号強度を用いて勾配に基づく改善を行う。
NVIDIA Sionnaの屋内シーンにおける実験では、2-4$\times$高速収束と10-100$\times$低い最終パラメータエラーが、均一あるいはランダムな初期化やランダムな配置ベースラインと比較され、受信機数で平均0.1%以下の相対誤差を達成した。
複雑度解析は材料数と測定装置数とほぼ直線的に1点当たりの時間スケールを示すが、VLM誘導配置は正確な回復に必要な測定を減少させる。
RT深度とレイ数に対するアブレーションは、氷点当たりのオーバヘッドが大きいことなく、さらなる精度の向上を確認する。
以上の結果から,VLMのセマンティック先行性は,高速かつ信頼性の高いRF材料推定のための物理に基づく最適化を効果的に導くことが示唆された。
関連論文リスト
- Resource-Efficient Beam Prediction in mmWave Communications with Multimodal Realistic Simulation Framework [57.994965436344195]
ビームフォーミングは、方向と強度を最適化して信号伝送を改善するミリ波通信において重要な技術である。
マルチモーダルセンシング支援ビーム予測は,ユーザ位置やネットワーク条件を予測するために,さまざまなセンサデータを使用して注目されている。
その有望な可能性にもかかわらず、マルチモーダルセンシング支援ビーム予測の採用は、高い計算複雑性、高いコスト、限られたデータセットによって妨げられている。
論文 参考訳(メタデータ) (2025-04-07T15:38:25Z) - How Critical is Site-Specific RAN Optimization? 5G Open-RAN Uplink Air Interface Performance Test and Optimization from Macro-Cell CIR Data [0.6753334733130354]
我々は,特定の地点からのチャネル計測データの重要性と,その空気界面の最適化と試験への影響を考察する。
我々は, NR PUSCHアップリンクシミュレーションにOmniPHY-5Gニューラルレシーバを利用する。
提案手法は、事前学習と比較して1.85dBの低信号-雑音比(SNR)で10%のブロック誤り率(BLER)を達成する。
論文 参考訳(メタデータ) (2024-10-25T13:57:48Z) - Revisit Event Generation Model: Self-Supervised Learning of Event-to-Video Reconstruction with Implicit Neural Representations [11.874972134063638]
本稿では,ラベル付きデータや光フロー推定を必要としない新しいSSLイベント・ビデオ再構成手法であるEvINRを提案する。
我々は、(x, y, t)$を座標とする暗黙的ニューラル表現(INR)を用いて、事象発生方程式を表現する。
オンラインの要求に対してEvINRを実現するために,トレーニングプロセスを大幅に高速化するいくつかのアクセラレーション手法を提案する。
論文 参考訳(メタデータ) (2024-07-26T04:18:10Z) - Learning Radio Environments by Differentiable Ray Tracing [56.40113938833999]
本稿では, 材料特性, 散乱, アンテナパターンの微分パラメトリゼーションによって補う, 勾配式キャリブレーション法を提案する。
提案手法は,MIMO(分散マルチインプットマルチインプット・マルチアウトプット・チャネル・サウンドア)を用いて,合成データと実世界の屋内チャネル計測の両方を用いて検証した。
論文 参考訳(メタデータ) (2023-11-30T13:50:21Z) - Analyzing the Internals of Neural Radiance Fields [4.681790910494339]
粗大なサンプリングに使用される大規模で訓練されたReLU-MLPを解析する。
中間活性化を重み推定に変換することで、これらの大きなミニマ活性化をいかに加速できるかを示す。
論文 参考訳(メタデータ) (2023-06-01T14:06:48Z) - Sionna RT: Differentiable Ray Tracing for Radio Propagation Modeling [65.17711407805756]
Sionnaは、リンクレベルのシミュレーションをベースとしたGPUアクセラレーションのオープンソースライブラリである。
リリース v0.14 以降、電波伝搬のシミュレーションのために微分可能なレイトレーサ (RT) を統合している。
論文 参考訳(メタデータ) (2023-03-20T13:40:11Z) - Boosting 3D Object Detection by Simulating Multimodality on Point Clouds [51.87740119160152]
本稿では,LiDAR 画像検出器に追従する特徴や応答をシミュレートすることで,単一モダリティ (LiDAR) 3次元物体検出器を高速化する新しい手法を提案する。
このアプローチでは、単一モダリティ検出器をトレーニングする場合のみ、LiDARイメージデータを必要とし、十分にトレーニングされた場合には、推論時にのみLiDARデータが必要である。
nuScenesデータセットの実験結果から,本手法はSOTA LiDARのみの3D検出器よりも優れていることがわかった。
論文 参考訳(メタデータ) (2022-06-30T01:44:30Z) - Automatic Velocity Picking Using a Multi-Information Fusion Deep
Semantic Segmentation Network [0.0]
地震データ処理における重要なステップである速度抽出は、何十年にもわたって研究されてきた。
深層学習(DL)法は,中・高信号-雑音比(SNR)の地震データに対して良好な結果を得た。
速度スペクトルとスタック集合セグメントの融合情報から積み重ね速度を推定する多情報融合ネットワーク(MIFN)を提案する。
論文 参考訳(メタデータ) (2022-05-07T12:55:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。