論文の概要: RA-LWLM: Retrieval-Augmented In-Context Localization with Wireless Foundation Models
- arxiv url: http://arxiv.org/abs/2606.01899v1
- Date: Mon, 01 Jun 2026 08:39:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:31.622773
- Title: RA-LWLM: Retrieval-Augmented In-Context Localization with Wireless Foundation Models
- Title(参考訳): RA-LWLM:無線ファンデーションモデルを用いた検索拡張インコンテキストローカライゼーション
- Authors: Guangjin Pan, Hui Chen, Hei Victor Cheng, Henk Wymeersch,
- Abstract要約: RA-LWLMは、検索拡張インコンテキストローカライゼーションフレームワークである。
シーン固有の情報を、シーンごとの指紋データベースに外部化する。
RA-LWLMは、シーンごとの再トレーニングを行わずに、見かけや見えないシーンでほぼ同じ精度を達成する。
- 参考スコア(独自算出の注目度): 30.551230783361422
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Wireless localization is a fundamental capability of sixth-generation (6G) networks. Conventional model-based methods require accurate modeling of the propagation environment and degrade in complex multipath and non-line-of-sight scenarios, while learning-based methods couple model parameters tightly to the training scene, requiring costly retraining whenever the base station (BS) configuration or propagation environment changes. In this paper, we propose RA-LWLM, a retrieval-augmented in-context localization framework that achieves training-free cross-scene adaptation by externalizing scene-specific information into a per-scene fingerprint database rather than encoding it in model weights. The framework consists of three components: a frozen wireless foundation model (FM) encoder that maps raw channel state information into a scene-agnostic representation; a retrieval module that selects the most informative references from the per-scene database via similarity search in the representation space; and a transformer-based in-context learning (ICL) module that fuses the query with the retrieved references to predict the user equipment (UE) position. To accommodate varying retrieval quality and propagation complexity across queries, the ICL module adopts a mixture-of-experts design in which experts specialize in different context sizes and are softly combined by a learnable selector. Extensive ray-tracing-based experiments across heterogeneous scenes with diverse BS configurations show that RA-LWLM achieves nearly identical accuracy on seen and unseen scenes without any per-scene retraining, substantially outperforming end-to-end and FM-based baselines. These results validate the proposed retrieval-augmented in-context paradigm as a scalable solution for cross-scene localization in 6G networks.
- Abstract(参考訳): ワイヤレスローカライゼーションは第6世代(6G)ネットワークの基本機能である。
従来のモデルベース手法では、伝搬環境を正確にモデル化し、複雑なマルチパスや非線形シナリオで分解する必要があるが、学習ベースの手法では、モデルパラメータをトレーニングシーンと密に結合し、ベースステーション(BS)の設定や伝播環境が変化するたびに、コストがかかる。
本稿では,RA-LWLMを提案する。RA-LWLMは,シーン固有の情報をモデル重みに符号化するのではなく,シーンごとの指紋データベースに外部化することで,トレーニング不要なクロスシーン適応を実現する。
フレームワークは、生チャネルの状態情報をシーンに依存しない表現にマッピングするフリーズ無線基礎モデル(FM)エンコーダと、表現空間内の類似性探索を介してシーン間データベースから最も情報性の高い参照を選択する検索モジュールと、検索した参照とクエリを融合してユーザ機器(UE)位置を予測するトランスフォーマーベースのインコンテキスト学習(ICL)モジュールの3つのコンポーネントから構成される。
クエリ間の検索品質と伝播の複雑さの変動に対応するため、ICLモジュールは、専門家が異なるコンテキストサイズを専門とし、学習可能なセレクタでソフトに結合する、エキスパートの混合設計を採用する。
多様なBS構成を持つ異種シーンを対象とする広範囲なレイトレーシングによる実験により、RA-LWLMはシーンごとのトレーニングをせずに、ほぼ同じ精度で、エンドツーエンドとFMベースのベースラインをほぼ上回ることが示されている。
これらの結果は,6Gネットワークにおけるクロスシーンローカライゼーションのためのスケーラブルなソリューションとして,検索拡張インコンテキストパラダイムを検証した。
関連論文リスト
- Replacing Parameters with Preferences: Federated Alignment of Heterogeneous Vision-Language Models [63.70401095689976]
VLM(Vision-Language Models)は、医療や金融といったプライバシに敏感な分野において大きな可能性を秘めている。
ヘテロジニアスVLMのためのGRPOとMixture-of-Rewardsを組み合わせた協調アライメントフレームワークであるMoRを提案する。
MoRは、一般化とクロスクライアント適応性において、フェデレートされたアライメントベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2026-05-05T07:02:50Z) - Few-Shot Video Object Segmentation in X-Ray Angiography Using Local Matching and Spatio-Temporal Consistency Loss [13.850743997507488]
探索空間を最も近いピクセルに制限する局所マッチング戦略を用いた新しいFSVOSモデルを提案する。
具体的には、動的に異なるサンプリング領域を実現できる非パラメトリックサンプリング機構を実装した。
この研究は、幅広い臨床応用のための強化されたポテンシャルを提供する。
論文 参考訳(メタデータ) (2026-01-02T21:26:28Z) - Generative MIMO Beam Map Construction for Location Recovery and Beam Tracking [67.65578956523403]
本稿では,スパースチャネル状態情報(CSI)から位置ラベルを直接復元する生成フレームワークを提案する。
生のCSIを直接格納する代わりに、小型の低次元無線地図の埋め込みを学び、生成モデルを利用して高次元CSIを再構築する。
数値実験により,NLOSシナリオにおける局所化精度が30%以上向上し,20%のキャパシティゲインが得られることが示された。
論文 参考訳(メタデータ) (2025-11-21T07:25:49Z) - In-Context Learning for Gradient-Free Receiver Adaptation: Principles, Applications, and Theory [54.92893355284945]
ディープラーニングベースの無線受信機は、様々なチャネル環境に動的に適応する能力を提供する。
ジョイントトレーニング、ハイパーネットワークベースの手法、メタラーニングを含む現在の適応戦略は、限られた柔軟性を示すか、勾配降下による明示的な最適化を必要とする。
本稿では、インコンテキスト学習(ICL)の新たなパラダイムに根ざした勾配なし適応手法を提案する。
論文 参考訳(メタデータ) (2025-06-18T06:43:55Z) - Large Wireless Localization Model (LWLM): A Foundation Model for Positioning in 6G Networks [26.30108656575931]
本稿では,無線位置決めに適したファンデーションモデルに基づくソリューションを提案する。
まず、異なる自己教師付き学習(SSL)タスクが汎用的およびタスク固有の意味的特徴をどのように獲得するかを分析する。
提案するLarge Wireless Localization Model (LWLM) の事前学習手法を設計する。
論文 参考訳(メタデータ) (2025-05-15T10:04:44Z) - FedRSClip: Federated Learning for Remote Sensing Scene Classification Using Vision-Language Models [23.830133838392964]
本稿では,VLM,特にCLIPに基づくリモートセンシング画像分類のための最初のフェデレーション学習フレームワークであるFedRSCLIPを提案する。
FedRSCLIPは、Prompt Learningを導入することで、フェデレーション環境におけるデータ不均一性と大規模モデル伝送の課題に対処する。
提案モデルの有効性を検証するため,既存の3つのリモートセンシング画像分類データセットに基づいてFed-RSICデータセットを構築した。
論文 参考訳(メタデータ) (2025-01-05T07:10:27Z) - R-SFLLM: Jamming Resilient Framework for Split Federated Learning with Large Language Models [65.04475956174959]
Split Federated Learning (SFL)は、分散機械学習(ML)における計算効率のパラダイムである。
SFLにおける重要な課題は、特に無線チャネル上に展開する場合、送信されたモデルパラメータの敵ジャミングに対する感受性である。
本稿では,無線ネットワーク上での大規模言語モデル (LLM) と視覚言語モデル (VLM) を用いたレジリエンスSFLのための物理層フレームワークを開発する。
論文 参考訳(メタデータ) (2024-07-16T12:21:29Z) - Transformer-based Federated Learning for Multi-Label Remote Sensing Image Classification [2.3255040478777755]
各種クライアントにおける非IIDトレーニングデータに関連する課題に対処するために,最先端のトランスフォーマーアーキテクチャが適用可能であるかを検討する。
トランスフォーマーアーキテクチャは、局所的なトレーニングと集約の複雑さの増大により、能力を高める。
論文 参考訳(メタデータ) (2024-05-24T10:13:49Z) - Bilevel Fast Scene Adaptation for Low-Light Image Enhancement [50.639332885989255]
低照度シーンにおける画像の強調は、コンピュータビジョンにおいて難しいが、広く懸念されている課題である。
主な障害は、異なるシーンにまたがる分散の相違によるモデリングの混乱にある。
上述の潜在対応をモデル化するための双レベルパラダイムを導入する。
エンコーダのシーン非関連な一般化を多様なシーンにもたらすために、双方向学習フレームワークを構築した。
論文 参考訳(メタデータ) (2023-06-02T08:16:21Z) - Retrieval and Localization with Observation Constraints [12.010135672015704]
RLOCSと呼ばれる視覚的再局在化手法を提案する。
画像検索、意味整合性、幾何学的検証を組み合わせて正確な推定を行う。
本手法は, ローカライゼーションベンチマークにおいて多くの性能向上を実現している。
論文 参考訳(メタデータ) (2021-08-19T06:14:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。