論文の概要: A Multi-Task Foundation Model for Wireless Channel Representation Using Contrastive and Masked Autoencoder Learning
- arxiv url: http://arxiv.org/abs/2505.09160v2
- Date: Wed, 22 Oct 2025 00:52:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:05.726696
- Title: A Multi-Task Foundation Model for Wireless Channel Representation Using Contrastive and Masked Autoencoder Learning
- Title(参考訳): コントラストとマスクオートエンコーダ学習を用いた無線チャネル表現のためのマルチタスク基礎モデル
- Authors: Berkay Guler, Giovanni Geraci, Hamid Jafarkhani,
- Abstract要約: ContraWiMAEは、トランスフォーマーベースの基礎モデルであり、無線チャネル表現のためのマスク付き再構成とマスク付きコントラスト学習を統一する。
私たちの重要なイノベーションは、ノイズ、フェーディング、部分的な可観測性など、ワイヤレス環境の固有の特性を自然な拡張として活用する、新しいワイヤレスインスパイアされたコントラストの目標です。
- 参考スコア(独自算出の注目度): 19.277001743060435
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current applications of self-supervised learning to wireless channel representation often borrow paradigms developed for text and image processing, without fully addressing the unique characteristics and constraints of wireless communications. To bridge this gap, we introduce ContraWiMAE, Wireless Contrastive Masked Autoencoder, a transformer-based foundation model that unifies masked reconstruction and masked contrastive learning for wireless channel representation. Our key innovation is a new wireless-inspired contrastive objective that exploits the inherent characteristics of wireless environment, including noise, fading, and partial observability, as natural augmentation. Through extensive evaluation on unseen scenarios and conditions, we demonstrate our method's effectiveness in multiple downstream tasks, including cross-frequency beam selection, line-of-sight detection, and channel estimation. ContraWiMAE exhibits superior linear separability and adaptability in diverse wireless environments, demonstrating exceptional data efficiency and competitive performance compared with supervised baselines under challenging conditions. Comparative evaluations against a state-of-the-art wireless channel foundation model confirm the superior performance and data efficiency of our approach, highlighting its potential as a powerful baseline for future research in self-supervised wireless channel representation learning. To foster further work in this direction, we release the model weights and training pipeline for ContraWiMAE.
- Abstract(参考訳): 無線チャネル表現への自己教師あり学習の現在の応用は、しばしば、無線通信のユニークな特徴や制約を完全に解決することなく、テキストや画像処理のために開発されたパラダイムを借用する。
このギャップを埋めるために、我々は、トランスフォーマーベースの基盤モデルであるContraWiMAE(Wireless Contrastive Masked Autoencoder)を紹介した。
私たちの重要なイノベーションは、ノイズ、フェーディング、部分的な可観測性など、ワイヤレス環境の固有の特性を自然な拡張として活用する、新しいワイヤレスインスパイアされたコントラストの目標です。
予測不能なシナリオと条件を広範囲に評価することにより、クロス周波数ビーム選択、ラインオブビュー検出、チャネル推定など、複数のダウンストリームタスクにおいて、提案手法の有効性を実証する。
ContraWiMAEは、様々な無線環境において優れた線形分離性と適応性を示し、例外的なデータ効率と競争性能を示す。
現状の無線チャネル基盤モデルとの比較評価により,提案手法の優れた性能とデータ効率が確認され,今後の自己教師型無線チャネル表現学習における強力なベースラインとしての可能性が浮き彫りにされている。
この方向へのさらなる作業を促進するため、ContraWiMAEのモデルウェイトとトレーニングパイプラインをリリースする。
関連論文リスト
- A Multi-Modal Foundational Model for Wireless Communication and Sensing [5.101849923596286]
本研究は,物理層無線システムのタスク非依存・マルチモーダル基礎モデルを提案する。
異質なモダリティにまたがる移動可能で物理学を意識した表現を学習し、タスクや環境をまたいだ堅牢な一般化を可能にしている。
本評価は,タスク固有のベースラインと比較して,より優れた一般化,デプロイメントシフトに対する堅牢性,データ要求の削減を示す。
論文 参考訳(メタデータ) (2026-02-03T21:03:23Z) - MMSense: Adapting Vision-based Foundation Model for Multi-task Multi-modal Wireless Sensing [7.577654996150275]
MMSenseは統合無線センシングのためのマルチモーダル・マルチタスク基礎モデルである。
我々のフレームワークは、画像、レーダー、LiDAR、テキストデータを視覚に適合する表現に変換することで統合する。
モダリティゲーティング・メカ・ニムはこれらの表現を適応的に融合させ、視覚ベースの大きな言語モデルバックボーンは特徴整合化を可能にする。
論文 参考訳(メタデータ) (2025-11-15T17:35:39Z) - SkillMimic-V2: Learning Robust and Generalizable Interaction Skills from Sparse and Noisy Demonstrations [68.9300049150948]
インタラクション実証(Reinforcement Demonstration, RLID)からの強化学習における根本的な課題に対処する。
既存のデータ収集アプローチはスパース、非接続、ノイズのトラジェクトリを生成し、スキルのバリエーションとトランジションの完全なスペクトルをキャプチャできない。
本稿では,実証技術間の潜在的な遷移を検出するStitched Trajectory Graph (STG) と,実証地区内の任意の状態に対するユニークな接続を確立するState Transition Field (STF) という2つのデータ拡張手法を提案する。
論文 参考訳(メタデータ) (2025-05-04T13:00:29Z) - A MIMO Wireless Channel Foundation Model via CIR-CSI Consistency [19.658024410165112]
本稿では,チャネル状態情報(CSI)とチャネルインパルス応答(CIR)を自然に整列したマルチモーダルデータとして扱う。
CIRとCSIの両方の結合表現を効果的にキャプチャすることで、CSI-CLIPはシナリオ間で顕著な適応性を示す。
論文 参考訳(メタデータ) (2025-02-17T16:13:40Z) - WirelessGPT: A Generative Pre-trained Multi-task Learning Framework for Wireless Communication [11.9521391877271]
本稿では,無線通信およびセンシングにおけるマルチタスク学習のための先駆的基礎モデルである WirelessGPT を紹介する。
初期パラメータサイズは約8000万で、従来のメソッドやより小さなAIモデルよりも大幅に改善されている。
WirelessGPTは、さまざまなドメインにわたる多様なタスクをサポートする最初の基礎モデルとして、新しいベンチマークを確立している。
論文 参考訳(メタデータ) (2025-02-08T12:38:56Z) - LaVin-DiT: Large Vision Diffusion Transformer [99.98106406059333]
LaVin-DiTは、20以上のコンピュータビジョンタスクを生成フレームワークで扱うために設計された、スケーラブルで統一された基盤モデルである。
視覚タスクの生成性能を最適化するための重要なイノベーションを紹介する。
このモデルは0.1Bから3.4Bのパラメータに拡張され、様々な視覚タスクにまたがる相当なスケーラビリティと最先端の性能を示す。
論文 参考訳(メタデータ) (2024-11-18T12:05:27Z) - Agent-driven Generative Semantic Communication with Cross-Modality and Prediction [57.335922373309074]
本稿では,強化学習に基づくエージェント駆動型ジェネリックセマンティックコミュニケーションフレームワークを提案する。
本研究では, エージェント支援型セマンティックエンコーダを開発し, 適応的セマンティック抽出とサンプリングを行う。
設計モデルの有効性をUA-DETRACデータセットを用いて検証し、全体的なA-GSCフレームワークの性能向上を実証した。
論文 参考訳(メタデータ) (2024-04-10T13:24:27Z) - Federated Multi-View Synthesizing for Metaverse [52.59476179535153]
メタバースは没入型エンターテイメント、教育、ビジネスアプリケーションを提供すると期待されている。
無線ネットワーク上のバーチャルリアリティ(VR)伝送は、データと計算集約である。
我々は,メタバースにおける無線コンテンツ配信のために,効率的な合成,記憶,通信資源を提供する,新しい多視点合成フレームワークを開発した。
論文 参考訳(メタデータ) (2023-12-18T13:51:56Z) - Physical-Layer Semantic-Aware Network for Zero-Shot Wireless Sensing [74.12670841657038]
デバイスレスワイヤレスセンシングは、幅広い没入型人間機械対話型アプリケーションをサポートする可能性から、近年、大きな関心を集めている。
無線信号におけるデータの均一性と分散センシングにおけるデータプライバシ規制は、広域ネットワークシステムにおける無線センシングの広範な適用を妨げる主要な課題であると考えられている。
そこで本研究では,ラベル付きデータを使わずに,一箇所ないし限られた箇所で構築されたモデルを直接他の場所に転送できるゼロショット無線センシングソリューションを提案する。
論文 参考訳(メタデータ) (2023-12-08T13:50:30Z) - Effective Adaptation in Multi-Task Co-Training for Unified Autonomous
Driving [103.745551954983]
本稿では,3つの下流タスクにおけるMoCoやSimCLRなど,多種多様な自己監督手法の転送性能について検討する。
彼らのパフォーマンスは、サブ最適か、あるいはシングルタスクベースラインよりもはるかに遅れていることに気付きました。
汎用マルチタスクトレーニングのための,単純かつ効果的な事前訓練-適応-ファインチューンパラダイムを提案する。
論文 参考訳(メタデータ) (2022-09-19T12:15:31Z) - Multi-Agent Feedback Enabled Neural Networks for Intelligent
Communications [28.723523146324002]
本稿では,新しいマルチエージェントフィードバック対応ニューラルネットワーク(MAFENN)フレームワークを提案する。
MAFENNフレームワークは理論的には3人プレイのFeedback Stackelbergゲームに定式化され、このゲームはFeedback Stackelberg平衡に収束することが証明される。
無線通信におけるMAFENNフレームワークの実現可能性を検証するため,マルチエージェントMAFENNベースの等化器(MAFENN-E)を開発した。
論文 参考訳(メタデータ) (2022-05-22T05:28:43Z) - Model-based Deep Learning Receiver Design for Rate-Splitting Multiple
Access [65.21117658030235]
本研究では,モデルベース深層学習(MBDL)に基づく実用的なRSMA受信機の設計を提案する。
MBDL受信機は、符号なしシンボル誤り率(SER)、リンクレベルシミュレーション(LLS)によるスループット性能、平均トレーニングオーバーヘッドの観点から評価される。
その結果,MBDLはCSIRが不完全なSIC受信機よりも優れていた。
論文 参考訳(メタデータ) (2022-05-02T12:23:55Z) - Multi-task Learning Approach for Modulation and Wireless Signal
Classification for 5G and Beyond: Edge Deployment via Model Compression [1.218340575383456]
将来的な通信網は、異種無線デバイスの成長に対応するために、少ないスペクトルに対処する必要がある。
我々は、深層ニューラルネットワークに基づくマルチタスク学習フレームワークの可能性を利用して、変調と信号分類タスクを同時に学習する。
公共利用のための包括的ヘテロジニアス無線信号データセットを提供する。
論文 参考訳(メタデータ) (2022-02-26T14:51:02Z) - ChaRRNets: Channel Robust Representation Networks for RF Fingerprinting [0.0]
RFフィンガープリントのための複雑値畳み込みニューラルネットワーク(CNN)を提案する。
我々は,深層学習(dl)技術を用いた無線iotデバイスの指紋認証の問題に注目する。
論文 参考訳(メタデータ) (2021-05-08T03:03:21Z) - Distributed Learning in Wireless Networks: Recent Progress and Future
Challenges [170.35951727508225]
次世代のワイヤレスネットワークは、エッジデバイスが収集するさまざまな種類のデータを分析する多くの機械学習ツールやアプリケーションを可能にする。
エッジデバイスが生データ交換なしでMLモデルを協調的にトレーニングできるようにする手段として,分散学習と推論技術が提案されている。
本稿では,ワイヤレスエッジネットワーク上で分散学習を効率的に効果的に展開する方法を包括的に研究する。
論文 参考訳(メタデータ) (2021-04-05T20:57:56Z) - Intelligent Reflecting Surface Aided Wireless Communications: A Tutorial [64.77665786141166]
インテリジェント反射面(Intelligent Reflecting Surface、IRS)は、無線ネットワークにおける電波伝搬を工学する技術である。
IRSは無線チャネルを動的に変更して通信性能を向上させることができる。
その大きな可能性にもかかわらず、IRSは無線ネットワークに効率的に統合されるための新たな課題に直面している。
論文 参考訳(メタデータ) (2020-07-06T13:59:09Z) - Harnessing Wireless Channels for Scalable and Privacy-Preserving
Federated Learning [56.94644428312295]
無線接続は、フェデレートラーニング(FL)の実現に有効である
Channel randomnessperturbs 各ワーカはモデル更新をインバージョンし、複数のワーカはバンド幅に大きな干渉を発生させる。
A-FADMMでは、すべてのワーカーがモデル更新をアナログ送信を介して単一のチャンネルを使用してパラメータサーバにアップロードする。
これは通信帯域幅を節約するだけでなく、各ワーカーの正確なモデル更新軌跡を任意の盗聴者から隠蔽する。
論文 参考訳(メタデータ) (2020-07-03T16:31:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。