論文の概要: RF-GPT: Teaching AI to See the Wireless World
- arxiv url: http://arxiv.org/abs/2602.14833v1
- Date: Mon, 16 Feb 2026 15:24:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-17 16:22:50.481622
- Title: RF-GPT: Teaching AI to See the Wireless World
- Title(参考訳): RF-GPT:AIにワイヤレス世界を見るように教える
- Authors: Hang Zou, Yu Tian, Bohao Wang, Lina Bariah, Samson Lasaulce, Chongwen Huang, Mérouane Debbah,
- Abstract要約: 大規模言語モデル(LLM)とマルチモーダルモデルは、強力な汎用推論システムとなっている。
RF-GPT(RF-GPT)は、マルチモーダルの視覚エンコーダを用いて、RFスペクトログラムの処理と理解を行う無線言語モデルである。
テキストのみのLLMは、これらのキャプションをRF地上の命令回答ペアに変換し、約12,000のRFシーンと2500万のサンプルを生成する。
- 参考スコア(独自算出の注目度): 48.294819966466044
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) and multimodal models have become powerful general-purpose reasoning systems. However, radio-frequency (RF) signals, which underpin wireless systems, are still not natively supported by these models. Existing LLM-based approaches for telecom focus mainly on text and structured data, while conventional RF deep-learning models are built separately for specific signal-processing tasks, highlighting a clear gap between RF perception and high-level reasoning. To bridge this gap, we introduce RF-GPT, a radio-frequency language model (RFLM) that utilizes the visual encoders of multimodal LLMs to process and understand RF spectrograms. In this framework, complex in-phase/quadrature (IQ) waveforms are mapped to time-frequency spectrograms and then passed to pretrained visual encoders. The resulting representations are injected as RF tokens into a decoder-only LLM, which generates RF-grounded answers, explanations, and structured outputs. To train RF-GPT, we perform supervised instruction fine-tuning of a pretrained multimodal LLM using a fully synthetic RF corpus. Standards-compliant waveform generators produce wideband scenes for six wireless technologies, from which we derive time-frequency spectrograms, exact configuration metadata, and dense captions. A text-only LLM then converts these captions into RF-grounded instruction-answer pairs, yielding roughly 12,000 RF scenes and 0.625 million instruction examples without any manual labeling. Across benchmarks for wideband modulation classification, overlap analysis, wireless-technology recognition, WLAN user counting, and 5G NR information extraction, RF-GPT achieves strong multi-task performance, whereas general-purpose VLMs with no RF grounding largely fail.
- Abstract(参考訳): 大規模言語モデル(LLM)とマルチモーダルモデルは、強力な汎用推論システムとなっている。
しかしながら、無線システムを支える無線周波数(RF)信号は、これらのモデルによってネイティブにサポートされていない。
既存のLLMベースの通信方式は主にテキストと構造化データに焦点をあてるが、従来のRF深層学習モデルは特定の信号処理タスクのために別々に構築されており、RF知覚と高レベルの推論との明確なギャップを浮き彫りにしている。
このギャップを埋めるために,マルチモーダルLLMの視覚エンコーダを用いたRF-GPT(RF周波数言語モデル)を導入し,RFスペクトログラムの処理と理解を行う。
このフレームワークでは、複雑な相/四分法(IQ)波形を時間周波数のスペクトログラムにマッピングし、事前訓練された視覚エンコーダに渡す。
得られた表現は、RFトークンとしてデコーダのみのLLMに注入され、RFグラウンドの回答、説明、構造化された出力を生成する。
RF-GPTを訓練するために,完全合成RFコーパスを用いて事前訓練したマルチモーダルLLMの微調整を行う。
標準に準拠した波形生成装置は6つの無線技術に対して広帯域のシーンを生成し、そこから時間周波数スペクトログラム、正確な構成メタデータ、高密度キャプションを導出する。
テキストのみのLLMは、これらのキャプションをRF地上の命令回答ペアに変換し、およそ12,000のRFシーンと0.625万の命令例を手動ラベリングなしで生成する。
広帯域変調分類、オーバーラップ解析、無線技術認識、WLANユーザカウント、および5G NR情報抽出のためのベンチマークにおいて、RF-GPTは強いマルチタスク性能を達成する一方、RF接地のない汎用VLMはほとんど失敗する。
関連論文リスト
- Radiance-Field Reinforced Pretraining: Scaling Localization Models with Unlabeled Wireless Signals [5.688789306551577]
無線周波数(RF)ベースの屋内ローカライゼーションは、屋内ナビゲーション、拡張現実、広範コンピューティングなどのアプリケーションに有望である。
RFRP(Radiance-Field Reinforced Pretraining)の導入
この新しい自己教師型事前学習フレームワークは、非対称オートエンコーダアーキテクチャにおいて、大規模な局在モデル(LM)とニューラルラジオ周波数放射場(RF-NeRF)を結合する。
RFRPプレトレーニングLMは,非事前学習モデルに比べて40%以上,教師あり学習モデルに比べて21%以上,局所化誤差を減少させることを示した。
論文 参考訳(メタデータ) (2025-12-08T08:52:08Z) - Rasterizing Wireless Radiance Field via Deformable 2D Gaussian Splatting [10.200300617390013]
無線放射場(WRF)のモデル化は,現代の通信システムの基本である。
任意の位置でWRFスペクトルを合成する変形可能な2DスプレイティングフレームワークであるSwiftWRFを提案する。
実世界と合成室内の両方の実験では、SwiftWRFが既存の最先端の手法よりも500倍早くWRFを再構築できることが示されている。
論文 参考訳(メタデータ) (2025-06-15T09:36:45Z) - RadioLLM: Introducing Large Language Model into Cognitive Radio via Hybrid Prompt and Token Reprogrammings [15.98684925275276]
大言語モデル(LLM)は認知無線技術(CRT)の進展に新たな可能性をもたらす
提案するRadioLLMは,無線信号特徴と専門知識を組み合わせたHPTR(Hybrid Prompt and Token Regramming)と高頻度特徴モデリングのためのFAF( Frequency-Attuned Fusion)モジュールを組み合わせた新しいフレームワークである。
論文 参考訳(メタデータ) (2025-01-28T07:38:04Z) - Beam Prediction based on Large Language Models [51.45077318268427]
時系列予測タスクとしてミリ波(mmWave)ビーム予測問題を定式化する。
我々は、歴史的観測をトレーニング可能なトークン化器を用いてテキストベースの表現に変換する。
提案手法はLLMのパワーを利用して将来の最適ビームを予測する。
論文 参考訳(メタデータ) (2024-08-16T12:40:01Z) - R-SFLLM: Jamming Resilient Framework for Split Federated Learning with Large Language Models [65.04475956174959]
Split Federated Learning (SFL)は、分散機械学習(ML)における計算効率のパラダイムである。
SFLにおける重要な課題は、特に無線チャネル上に展開する場合、送信されたモデルパラメータの敵ジャミングに対する感受性である。
本稿では,無線ネットワーク上での大規模言語モデル (LLM) と視覚言語モデル (VLM) を用いたレジリエンスSFLのための物理層フレームワークを開発する。
論文 参考訳(メタデータ) (2024-07-16T12:21:29Z) - RF-Diffusion: Radio Signal Generation via Time-Frequency Diffusion [15.175370227353406]
RF信号の時間・周波数・複素値領域における情報入力を可能にするため,新しい時間周波数拡散理論を導入する。
RF拡散(RF-Diffusion)は、多種多様な高品質かつ時系列のRFデータを生成する汎用的なソリューションである。
また、5Gネットワークにおいて、Wi-Fiセンシングシステムを強化し、チャネル推定を行う上で、RF拡散の汎用性を示す。
論文 参考訳(メタデータ) (2024-04-14T04:56:05Z) - Three-Way Deep Neural Network for Radio Frequency Map Generation and
Source Localization [67.93423427193055]
空間、時間、周波数領域にわたる無線スペクトルのモニタリングは、5Gと6G以上の通信技術において重要な特徴となる。
本稿では,空間領域全体にわたる不規則分散計測を補間するGAN(Generative Adversarial Network)機械学習モデルを提案する。
論文 参考訳(メタデータ) (2021-11-23T22:25:10Z) - Wavelet-Based Network For High Dynamic Range Imaging [64.66969585951207]
光学フローベースやエンド・ツー・エンドのディープラーニングベースのソリューションのような既存の方法は、詳細な復元やゴーストを除去する際にエラーを起こしやすい。
本研究では、周波数領域でHDR融合を行うための新しい周波数誘導型エンド・ツー・エンドディープニューラルネットワーク(FNet)を提案し、ウェーブレット変換(DWT)を用いて入力を異なる周波数帯域に分解する。
低周波信号は特定のゴーストアーティファクトを避けるために使用され、高周波信号は詳細を保存するために使用される。
論文 参考訳(メタデータ) (2021-08-03T12:26:33Z) - Spectro-Temporal RF Identification using Deep Learning [3.8137985834223507]
WRISTは、分光時間検出、フレームワーク、システムを備えた広帯域リアルタイムRF識別システムである。
得られたディープラーニングモデルは、時間と周波数のRF放射を検出し、分類し、正確に検出することができる。
WRIST検出器は、野生の非常に密集した環境でも平均的な平均精度が90に達する。
論文 参考訳(メタデータ) (2021-07-11T19:02:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。