論文の概要: 6G WavesFM: A Foundation Model for Sensing, Communication, and Localization
- arxiv url: http://arxiv.org/abs/2504.14100v1
- Date: Fri, 18 Apr 2025 22:51:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-30 05:10:42.843473
- Title: 6G WavesFM: A Foundation Model for Sensing, Communication, and Localization
- Title(参考訳): 6G WavesFM: センシング・コミュニケーション・ローカライゼーションの基礎モデル
- Authors: Ahmed Aboulfotouh, Elsayed Mohammed, Hatem Abou-Zeid,
- Abstract要約: 本稿では,無線基礎モデル(WFM)フレームワークについて紹介する。
提案アーキテクチャでは,共有ビジョントランスフォーマー(ViT)バックボーンとタスク固有の多層パーセプトロンヘッドを組み合わせるとともに,パラメータ効率の良い微調整のためのローランド適応(LoRA)を組み込む。
我々は、統一WFMが多様なタスクをサポートし、性能と効率の両方において大きな利益をもたらすことを示す。
- 参考スコア(独自算出の注目度): 6.70088826174291
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces WavesFM, a novel Wireless Foundation Model (WFM) framework, capable of supporting a wide array of communication, sensing, and localization tasks. Our proposed architecture combines a shared Vision Transformer (ViT) backbone with task-specific multi-layer perceptron (MLP) heads and incorporates Low-Rank Adaptation (LoRA) for parameter-efficient fine-tuning. This design promotes full parameter sharing across tasks, significantly reducing the computational and memory footprint without sacrificing performance. The model processes both image-like wireless modalities, such as spectrograms and channel state information (CSI), and in-phase and quadrature (IQ) signals arranged as orthogonal frequency-division multiplexing (OFDM) resource grids. We demonstrate the strong generalization capabilities of WavesFM through extensive experiments on four downstream tasks: Fifth Generation New Radio (5G NR) positioning; multiple-input multiple-output OFDM (MIMO-OFDM) channel estimation; human activity sensing; and radio-frequency (RF) signal classification. Compared to supervised baselines trained individually, our approach achieves superior performance while sharing 80% of its parameters across tasks. Furthermore, we show that pretraining on domain-relevant data not only boosts performance but also accelerates convergence, reducing training time by up to 5x. These results demonstrate that our unified WFM can support diverse tasks and deliver significant gains in both performance and efficiency, highlighting the transformative potential of foundation models to drive AI-native paradigms in future sixth-generation (6G) networks.
- Abstract(参考訳): 本稿では,新しい無線基礎モデル(WFM)フレームワークであるWavesFMを紹介する。
提案アーキテクチャでは,共有ビジョントランスフォーマー(ViT)バックボーンとタスク固有多層パーセプトロン(MLP)ヘッドを組み合わせるとともに,パラメータ効率の良い微調整のためのローランド適応(LoRA)を組み込む。
この設計はタスク間の完全なパラメータ共有を促進し、性能を犠牲にすることなく計算量とメモリフットプリントを大幅に削減する。
このモデルは、分光図やチャネル状態情報(CSI)のような画像のような無線モードと、直交周波数分割多重化(OFDM)リソースグリッドとして配置されたインフェーズおよび二次(IQ)信号の両方を処理する。
我々は、第5世代ニューラジオ(5G NR)測位、マルチインプット多重出力OFDM(MIMO-OFDM)チャネル推定、人間の活動センシング、電波周波数(RF)信号分類という4つの下流タスクに関する広範な実験を通して、WavesFMの強力な一般化能力を実証した。
個別に訓練された教師付きベースラインと比較して,タスク間で80%のパラメータを共有しながら,優れたパフォーマンスを実現している。
さらに、ドメイン関連データに対する事前トレーニングは、パフォーマンスを向上するだけでなく、収束を加速し、トレーニング時間を最大5倍に短縮することを示す。
これらの結果は、我々の統合WFMが多様なタスクをサポートし、パフォーマンスと効率の両方において大きな利益をもたらすことを示しており、将来の第6世代(6G)ネットワークにおいてAIネイティブパラダイムを駆動する基礎モデルの変革の可能性を強調している。
関連論文リスト
- GDM4MMIMO: Generative Diffusion Models for Massive MIMO Communications [61.56610953012228]
生成拡散モデル (generative diffusion model, GDM) は、生成モデルの最先端のファミリーの一つである。
GDMは、暗黙の事前知識と堅牢な一般化能力を学ぶ能力を示す。
ケーススタディは、GDMが有望な、効率的な超次元チャネルステートメント情報取得を促進する可能性を示唆している。
論文 参考訳(メタデータ) (2024-12-24T08:42:01Z) - RadioDiff: An Effective Generative Diffusion Model for Sampling-Free Dynamic Radio Map Construction [42.596399621642234]
無線マップ(RM)は、位置のみに基づいてパスロスを得ることができる有望な技術である。
本稿では, サンプリングフリーのRM構造を条件付き生成問題としてモデル化し, 高品質なRM構造を実現するためにRadioDiffという名前の拡散拡散法を提案する。
実験の結果,提案したRadioDiffは,3つの精度,構造的類似度,ピーク信号対雑音比の3つの指標において,最先端性能を実現していることがわかった。
論文 参考訳(メタデータ) (2024-08-16T08:02:00Z) - MMA-DFER: MultiModal Adaptation of unimodal models for Dynamic Facial Expression Recognition in-the-wild [81.32127423981426]
実世界のアプリケーションでは,音声およびビデオデータに基づくマルチモーダル感情認識が重要である。
近年の手法は、強力なマルチモーダルエンコーダの事前学習に自己教師付き学習(SSL)の進歩を活用することに重点を置いている。
SSL-pre-trained disimodal encoders を用いて,この問題に対する異なる視点とマルチモーダル DFER の性能向上について検討する。
論文 参考訳(メタデータ) (2024-04-13T13:39:26Z) - Diffusion Model is an Effective Planner and Data Synthesizer for
Multi-Task Reinforcement Learning [101.66860222415512]
Multi-Task Diffusion Model (textscMTDiff) は、トランスフォーマーのバックボーンを組み込んだ拡散に基づく手法であり、生成計画とデータ合成のための素早い学習を行う。
生成計画において、textscMTDiffはMeta-World上の50のタスクとMaze2D上の8のマップで最先端のアルゴリズムより優れています。
論文 参考訳(メタデータ) (2023-05-29T05:20:38Z) - Multi-Flow Transmission in Wireless Interference Networks: A Convergent
Graph Learning Approach [9.852567834643292]
ネットワークデータ信号の2段階干渉対応マルチフロー最適化(DIAMOND)という新しいアルゴリズムを提案する。
集中型ステージは、グラフニューラルネットワーク(GNN)強化学習(RL)ルーティングエージェントの新しい設計を用いて、マルチフロー伝送戦略を計算する。
そして、分散学習更新の新しい設計に基づいて、分散ステージにより性能が向上する。
論文 参考訳(メタデータ) (2023-03-27T18:49:47Z) - On Neural Architectures for Deep Learning-based Source Separation of
Co-Channel OFDM Signals [104.11663769306566]
周波数分割多重化(OFDM)信号を含む単一チャネル音源分離問題について検討する。
我々はOFDM構造からの洞察に基づいて、ネットワークパラメータ化に対する重要なドメインインフォームド修正を提案する。
論文 参考訳(メタデータ) (2023-03-11T16:29:13Z) - Over-the-Air Federated Multi-Task Learning via Model Sparsification and
Turbo Compressed Sensing [48.19771515107681]
本稿では,エッジサーバの協調の下で,エッジデバイス上にデプロイされた複数の学習タスクを非直交型フェードチャネルで共有する,オーバー・ザ・エアのFMTLフレームワークを提案する。
OA-FMTLでは、エッジデバイスの局所的な更新はスパース化され、圧縮され、重ね合わせの方法でアップリンクチャネルに送信される。
提案するOA-FMTLフレームワークとM-Turbo-CSアルゴリズムの性能解析を行った。
論文 参考訳(メタデータ) (2022-05-08T08:03:52Z) - Multi-task Learning Approach for Modulation and Wireless Signal
Classification for 5G and Beyond: Edge Deployment via Model Compression [1.218340575383456]
将来的な通信網は、異種無線デバイスの成長に対応するために、少ないスペクトルに対処する必要がある。
我々は、深層ニューラルネットワークに基づくマルチタスク学習フレームワークの可能性を利用して、変調と信号分類タスクを同時に学習する。
公共利用のための包括的ヘテロジニアス無線信号データセットを提供する。
論文 参考訳(メタデータ) (2022-02-26T14:51:02Z) - Learning OFDM Waveforms with PAPR and ACLR Constraints [15.423422040627331]
達成可能な情報レートを最大化しつつ,選択した制約を満たすOFDMベースの波形を設計するための学習ベース手法を提案する。
エンドツーエンドシステムは,PAPRとACLRの制約を満たすことができ,スループットを著しく向上させることができることを示す。
論文 参考訳(メタデータ) (2021-10-21T08:58:59Z) - Multi-task Learning Approach for Automatic Modulation and Wireless
Signal Classification [1.827510863075184]
深層ニューラルネットワークの可能性をマルチタスク学習(MTL)フレームワークと組み合わせて活用し、変調と信号分類のタスクを同時に学習します。
我々は、レーダーと複数のラベルとの通信信号からなる唯一の既知のオープン異種無線信号データセットをリリースします。
論文 参考訳(メタデータ) (2021-01-25T17:43:42Z) - Modality Compensation Network: Cross-Modal Adaptation for Action
Recognition [77.24983234113957]
異なるモダリティの関係を探索するためのモダリティ補償ネットワーク(MCN)を提案する。
我々のモデルは、適応表現学習を実現するために、モーダリティ適応ブロックによって、ソースおよび補助モーダリティからのデータをブリッジする。
実験の結果,MCNは4つの広く使用されている行動認識ベンチマークにおいて,最先端のアプローチよりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-01-31T04:51:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。