論文の概要: A Multi-Task Foundation Model for Wireless Channel Representation Using Contrastive and Masked Autoencoder Learning
- arxiv url: http://arxiv.org/abs/2505.09160v1
- Date: Wed, 14 May 2025 05:45:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-15 21:44:09.38202
- Title: A Multi-Task Foundation Model for Wireless Channel Representation Using Contrastive and Masked Autoencoder Learning
- Title(参考訳): コントラストとマスクオートエンコーダ学習を用いた無線チャネル表現のためのマルチタスク基礎モデル
- Authors: Berkay Guler, Giovanni Geraci, Hamid Jafarkhani,
- Abstract要約: 本研究では,WiMAE(Wireless Masked Autoencoder)というトランスフォーマーベースのエンコーダ・デコーダ基礎モデルを提案する。
次に、コントラWiMAEを開発し、コントラスト学習目標と再構成タスクを統合マルチタスクフレームワークに組み込むことにより、WiMAEを強化する。
- 参考スコア(独自算出の注目度): 23.359670753271722
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current applications of self-supervised learning to wireless channel representation often borrow paradigms developed for text and image processing, without fully addressing the unique characteristics and constraints of wireless communications. Aiming to fill this gap, we first propose WiMAE (Wireless Masked Autoencoder), a transformer-based encoder-decoder foundation model pretrained on a realistic open-source multi-antenna wireless channel dataset. Building upon this foundation, we develop ContraWiMAE, which enhances WiMAE by incorporating a contrastive learning objective alongside the reconstruction task in a unified multi-task framework. By warm-starting from pretrained WiMAE weights and generating positive pairs via noise injection, the contrastive component enables the model to capture both structural and discriminative features, enhancing representation quality beyond what reconstruction alone can achieve. Through extensive evaluation on unseen scenarios, we demonstrate the effectiveness of both approaches across multiple downstream tasks, with ContraWiMAE showing further improvements in linear separability and adaptability in diverse wireless environments. Comparative evaluations against a state-of-the-art wireless channel foundation model confirm the superior performance and data efficiency of our models, highlighting their potential as powerful baselines for future research in self-supervised wireless channel representation learning.
- Abstract(参考訳): 無線チャネル表現への自己教師あり学習の現在の応用は、しばしば、無線通信のユニークな特徴や制約を完全に解決することなく、テキストや画像処理のために開発されたパラダイムを借用する。
このギャップを埋めるために、我々はまず、トランスフォーマーベースのエンコーダデコーダ基礎モデルであるWiMAE(Wireless Masked Autoencoder)を提案する。
この基盤の上に構築されたContraWiMAEは,統合マルチタスクフレームワークにおける再構成タスクと並行して,対照的な学習目標を組み込むことにより,WiMAEを向上する。
事前訓練されたWiMAE重みからウォームスタートし、ノイズ注入により正のペアを生成することで、コントラスト成分は、モデルが構造的特徴と識別的特徴の両方をキャプチャし、再構成だけで達成できる以上の表現品質を向上させることができる。
ContraWiMAEは, 様々な無線環境において, 線形分離性と適応性の向上を示すとともに, 両手法の有効性を実証する。
現状の無線チャネル基礎モデルとの比較により,我々のモデルの性能とデータ効率が向上し,今後の自己教師型無線チャネル表現学習における強力なベースラインとしての可能性を強調した。
関連論文リスト
- A MIMO Wireless Channel Foundation Model via CIR-CSI Consistency [19.658024410165112]
本稿では,チャネル状態情報(CSI)とチャネルインパルス応答(CIR)を自然に整列したマルチモーダルデータとして扱う。
CIRとCSIの両方の結合表現を効果的にキャプチャすることで、CSI-CLIPはシナリオ間で顕著な適応性を示す。
論文 参考訳(メタデータ) (2025-02-17T16:13:40Z) - WirelessGPT: A Generative Pre-trained Multi-task Learning Framework for Wireless Communication [11.9521391877271]
本稿では,無線通信およびセンシングにおけるマルチタスク学習のための先駆的基礎モデルである WirelessGPT を紹介する。
初期パラメータサイズは約8000万で、従来のメソッドやより小さなAIモデルよりも大幅に改善されている。
WirelessGPTは、さまざまなドメインにわたる多様なタスクをサポートする最初の基礎モデルとして、新しいベンチマークを確立している。
論文 参考訳(メタデータ) (2025-02-08T12:38:56Z) - LaVin-DiT: Large Vision Diffusion Transformer [99.98106406059333]
LaVin-DiTは、20以上のコンピュータビジョンタスクを生成フレームワークで扱うために設計された、スケーラブルで統一された基盤モデルである。
視覚タスクの生成性能を最適化するための重要なイノベーションを紹介する。
このモデルは0.1Bから3.4Bのパラメータに拡張され、様々な視覚タスクにまたがる相当なスケーラビリティと最先端の性能を示す。
論文 参考訳(メタデータ) (2024-11-18T12:05:27Z) - Agent-driven Generative Semantic Communication with Cross-Modality and Prediction [57.335922373309074]
本稿では,強化学習に基づくエージェント駆動型ジェネリックセマンティックコミュニケーションフレームワークを提案する。
本研究では, エージェント支援型セマンティックエンコーダを開発し, 適応的セマンティック抽出とサンプリングを行う。
設計モデルの有効性をUA-DETRACデータセットを用いて検証し、全体的なA-GSCフレームワークの性能向上を実証した。
論文 参考訳(メタデータ) (2024-04-10T13:24:27Z) - Physical-Layer Semantic-Aware Network for Zero-Shot Wireless Sensing [74.12670841657038]
デバイスレスワイヤレスセンシングは、幅広い没入型人間機械対話型アプリケーションをサポートする可能性から、近年、大きな関心を集めている。
無線信号におけるデータの均一性と分散センシングにおけるデータプライバシ規制は、広域ネットワークシステムにおける無線センシングの広範な適用を妨げる主要な課題であると考えられている。
そこで本研究では,ラベル付きデータを使わずに,一箇所ないし限られた箇所で構築されたモデルを直接他の場所に転送できるゼロショット無線センシングソリューションを提案する。
論文 参考訳(メタデータ) (2023-12-08T13:50:30Z) - Multi-Agent Feedback Enabled Neural Networks for Intelligent
Communications [28.723523146324002]
本稿では,新しいマルチエージェントフィードバック対応ニューラルネットワーク(MAFENN)フレームワークを提案する。
MAFENNフレームワークは理論的には3人プレイのFeedback Stackelbergゲームに定式化され、このゲームはFeedback Stackelberg平衡に収束することが証明される。
無線通信におけるMAFENNフレームワークの実現可能性を検証するため,マルチエージェントMAFENNベースの等化器(MAFENN-E)を開発した。
論文 参考訳(メタデータ) (2022-05-22T05:28:43Z) - Multi-task Learning Approach for Modulation and Wireless Signal
Classification for 5G and Beyond: Edge Deployment via Model Compression [1.218340575383456]
将来的な通信網は、異種無線デバイスの成長に対応するために、少ないスペクトルに対処する必要がある。
我々は、深層ニューラルネットワークに基づくマルチタスク学習フレームワークの可能性を利用して、変調と信号分類タスクを同時に学習する。
公共利用のための包括的ヘテロジニアス無線信号データセットを提供する。
論文 参考訳(メタデータ) (2022-02-26T14:51:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。