論文の概要: Multi-Task Semantic Communication With Graph Attention-Based Feature Correlation Extraction
- arxiv url: http://arxiv.org/abs/2501.02006v1
- Date: Thu, 02 Jan 2025 04:38:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-07 17:08:49.095766
- Title: Multi-Task Semantic Communication With Graph Attention-Based Feature Correlation Extraction
- Title(参考訳): グラフ注意に基づく特徴相関抽出を用いたマルチタスク意味コミュニケーション
- Authors: Xi Yu, Tiejun Lv, Weicai Li, Wei Ni, Dusit Niyato, Ekram Hossain,
- Abstract要約: 本稿では,マルチタスク・セマンティック・コミュニケーション・システムのエンコーダ/トランスミッタに新たなグラフアテンション・インターブロック(GAI)モジュールを提案する。
エンコーダの中間特徴抽出ブロックの出力をグラフのノードとして解釈し,その中間特徴の相関関係を捉える。
実験により、提案されたモデルは、CityScapes 2Taskデータセットにおいて、最も競争力があり、公開可能なモデルよりも11.4%多いことが示されている。
- 参考スコア(独自算出の注目度): 69.24689059980035
- License:
- Abstract: Multi-task semantic communication can serve multiple learning tasks using a shared encoder model. Existing models have overlooked the intricate relationships between features extracted during an encoding process of tasks. This paper presents a new graph attention inter-block (GAI) module to the encoder/transmitter of a multi-task semantic communication system, which enriches the features for multiple tasks by embedding the intermediate outputs of encoding in the features, compared to the existing techniques. The key idea is that we interpret the outputs of the intermediate feature extraction blocks of the encoder as the nodes of a graph to capture the correlations of the intermediate features. Another important aspect is that we refine the node representation using a graph attention mechanism to extract the correlations and a multi-layer perceptron network to associate the node representations with different tasks. Consequently, the intermediate features are weighted and embedded into the features transmitted for executing multiple tasks at the receiver. Experiments demonstrate that the proposed model surpasses the most competitive and publicly available models by 11.4% on the CityScapes 2Task dataset and outperforms the established state-of-the-art by 3.97% on the NYU V2 3Task dataset, respectively, when the bandwidth ratio of the communication channel (i.e., compression level for transmission over the channel) is as constrained as 1 12 .
- Abstract(参考訳): マルチタスクセマンティックコミュニケーションは、共有エンコーダモデルを用いて複数の学習タスクに役立てることができる。
既存のモデルは、タスクのエンコーディングプロセス中に抽出された特徴間の複雑な関係を見落としている。
本稿では,マルチタスク・セマンティック・コミュニケーション・システムのエンコーダ/トランスミッタに新たなグラフアテンション・インターブロック(GAI)モジュールを提案する。
鍵となる考え方は、エンコーダの中間特徴抽出ブロックの出力をグラフのノードとして解釈し、中間特徴の相関を捉えることである。
もう一つの重要な側面は、グラフアテンション機構を用いてノード表現を洗練して相関関係を抽出し、異なるタスクでノード表現を関連付ける多層パーセプトロンネットワークを構築することである。
その結果、中間機能は重み付けされ、受信機で複数のタスクを実行するために送信される特徴に埋め込まれる。
実験の結果,CityScapes 2Taskデータセットでは11.4%,NYU V2 3Taskデータセットでは3.97%,通信チャネルの帯域幅比(すなわち通信路を横断する圧縮レベル)が1.12.5%に制限された場合,提案モデルが最も競争力が高く,一般公開されたモデルでは11.4%を上回っていることがわかった。
関連論文リスト
- A Semantic-Aware and Multi-Guided Network for Infrared-Visible Image Fusion [41.34335755315773]
マルチモダリティ画像融合は、2つのソース画像から特定のモダリティ情報と共有モダリティ情報を融合することを目的としている。
本稿では,3分岐エンコーダデコーダアーキテクチャと,それに対応する融合層を融合戦略として提案する。
可視・近赤外画像融合および医用画像融合タスクにおける最先端手法と比較して,本手法は競争力のある結果を得た。
論文 参考訳(メタデータ) (2024-06-11T09:32:40Z) - A Point-Based Approach to Efficient LiDAR Multi-Task Perception [49.91741677556553]
PAttFormerは、ポイントクラウドにおける共同セマンティックセグメンテーションとオブジェクト検出のための効率的なマルチタスクアーキテクチャである。
他のLiDARベースのマルチタスクアーキテクチャとは異なり、提案したPAttFormerはタスク固有のポイントクラウド表現のために別の機能エンコーダを必要としない。
マルチタスク学習では,mIouでは+1.7%,mAPでは3Dオブジェクト検出では+1.7%,LiDARセマンティックセマンティックセグメンテーションは+1.7%向上した。
論文 参考訳(メタデータ) (2024-04-19T11:24:34Z) - Communication-Efficient Framework for Distributed Image Semantic
Wireless Transmission [68.69108124451263]
IoTデバイスを用いたマルチタスク分散画像伝送のためのFederated Learning-based semantic communication (FLSC)フレームワーク。
各リンクは階層型視覚変換器(HVT)ベースの抽出器とタスク適応トランスレータで構成される。
チャネル状態情報に基づく多重出力多重出力伝送モジュール。
論文 参考訳(メタデータ) (2023-08-07T16:32:14Z) - TFE-GNN: A Temporal Fusion Encoder Using Graph Neural Networks for
Fine-grained Encrypted Traffic Classification [35.211600580761726]
本稿では,PMI(point-wise mutual information)とテンポラルフュージョン(Temporal Fusion)というモデルに基づくバイトレベルのトラフィックグラフ構築手法を提案する。
特に,デュアル埋め込み層,GNNベースのトラヒックグラフエンコーダ,およびクロスゲート機能融合機構を設計する。
2つの実際のデータセットに対する実験結果から、TFE-GNNは、詳細な暗号化されたトラフィック分類タスクにおいて、最先端の複数の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-07-31T14:32:40Z) - A Dynamic Feature Interaction Framework for Multi-task Visual Perception [100.98434079696268]
複数の共通認識課題を解決するための効率的な統合フレームワークを考案する。
これらのタスクには、インスタンスセグメンテーション、セマンティックセグメンテーション、モノクル3D検出、深さ推定が含まれる。
提案するフレームワークはD2BNetと呼ばれ,マルチタスク認識のためのパラメータ効率予測に一意なアプローチを示す。
論文 参考訳(メタデータ) (2023-06-08T09:24:46Z) - Object Segmentation by Mining Cross-Modal Semantics [68.88086621181628]
マルチモーダル特徴の融合と復号を導くために,クロスモーダル・セマンティックスをマイニングする手法を提案する。
具体的には,(1)全周減衰核融合(AF),(2)粗大デコーダ(CFD),(3)多層自己超越からなる新しいネットワークXMSNetを提案する。
論文 参考訳(メタデータ) (2023-05-17T14:30:11Z) - Encoder Fusion Network with Co-Attention Embedding for Referring Image
Segmentation [87.01669173673288]
本稿では,視覚的エンコーダをマルチモーダルな特徴学習ネットワークに変換するエンコーダ融合ネットワーク(EFN)を提案する。
EFNには、マルチモーダル機能の並列更新を実現するコアテンションメカニズムが組み込まれている。
4つのベンチマークデータセットによる実験結果から,提案手法がポストプロセッシングを伴わずに最先端の性能を実現することを示す。
論文 参考訳(メタデータ) (2021-05-05T02:27:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。