論文の概要: Deep Joint Source-Channel Coding for Multi-Task Network
- arxiv url: http://arxiv.org/abs/2109.05779v1
- Date: Mon, 13 Sep 2021 08:58:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-15 03:26:07.581326
- Title: Deep Joint Source-Channel Coding for Multi-Task Network
- Title(参考訳): マルチタスクネットワークのためのディープジョイントソースチャネル符号化
- Authors: Mengyang Wang, Zhicong Zhang, Jiahui Li, Mengyao Ma and Xiaopeng Fan
- Abstract要約: 本稿では,CIシナリオ下での運用を可能にする,JSCC(ディープジョイントソースチャネル符号化)フレームワークを備えたMTLネットワークを提案する。
まず,統合オブジェクト検出とセマンティックセグメンテーションのための機能融合型MTLネットワーク(FFMNet)を提案する。
2つのネットワークを結合することにより、モデル全体が中間機能に対して512倍の圧縮を達成し、両方のタスクでパフォーマンス損失が2%以内となる。
- 参考スコア(独自算出の注目度): 13.542225779512824
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-task learning (MTL) is an efficient way to improve the performance of
related tasks by sharing knowledge. However, most existing MTL networks run on
a single end and are not suitable for collaborative intelligence (CI)
scenarios. In this work, we propose an MTL network with a deep joint
source-channel coding (JSCC) framework, which allows operating under CI
scenarios. We first propose a feature fusion based MTL network (FFMNet) for
joint object detection and semantic segmentation. Compared with other MTL
networks, FFMNet gets higher performance with fewer parameters. Then FFMNet is
split into two parts, which run on a mobile device and an edge server
respectively. The feature generated by the mobile device is transmitted through
the wireless channel to the edge server. To reduce the transmission overhead of
the intermediate feature, a deep JSCC network is designed. By combining two
networks together, the whole model achieves 512 times compression for the
intermediate feature and a performance loss within 2% on both tasks. At last,
by training with noise, the FFMNet with JSCC is robust to various channel
conditions and outperforms the separate source and channel coding scheme.
- Abstract(参考訳): マルチタスク学習(MTL)は、知識を共有することで、関連するタスクのパフォーマンスを向上させる効率的な方法である。
しかし、既存のほとんどのMTLネットワークは単一のエンドポイントで動作し、協調インテリジェンス(CI)のシナリオには適していない。
本研究では,CIシナリオ下での運用を可能にする,JSCC(ディープジョイントソースチャネルコーディング)フレームワークを備えたMTLネットワークを提案する。
まず,統合オブジェクト検出とセマンティックセグメンテーションのための機能融合型MTLネットワーク(FFMNet)を提案する。
他のMTLネットワークと比較して、FFMNetはより少ないパラメータで高い性能を得る。
その後、ffmnetはモバイルデバイスとエッジサーバ上で動作する2つのパーツに分割される。
モバイルデバイスが生成した機能は、無線チャネルを介してエッジサーバに送信される。
中間機能の伝送オーバーヘッドを低減するため、ディープjsccネットワークが設計されている。
2つのネットワークを組み合わせることで、モデル全体が中間機能に対して512倍の圧縮を達成し、両方のタスクで2%以内に性能が低下する。
最後に、ノイズのトレーニングによって、jsccによるffmnetは様々なチャネル条件に頑健になり、ソースとチャネルのコーディング方式よりも優れています。
関連論文リスト
- WDMoE: Wireless Distributed Mixture of Experts for Large Language Models [68.45482959423323]
大規模言語モデル(LLM)は様々な自然言語処理タスクにおいて大きな成功を収めた。
本稿では,無線ネットワーク上での基地局(BS)およびモバイルデバイスにおけるエッジサーバ間のLLMの協調展開を実現するために,無線分散Mixture of Experts(WDMoE)アーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-11-11T02:48:00Z) - CSFNet: A Cosine Similarity Fusion Network for Real-Time RGB-X Semantic Segmentation of Driving Scenes [0.0]
マルチモーダルなセマンティックセグメンテーション手法は、高い計算複雑性と低い推論速度に悩まされる。
本稿では,リアルタイムRGB-XセマンティックセマンティックセグメンテーションモデルとしてCosine similarity Fusion Network (CSFNet)を提案する。
CSFNetは最先端の手法と競合する精度を持ち、速度に関しては最先端の手法である。
論文 参考訳(メタデータ) (2024-07-01T14:34:32Z) - WDMoE: Wireless Distributed Large Language Models with Mixture of Experts [65.57581050707738]
我々は,Mixture of Experts (MoE)に基づく無線分散大言語モデル(LLM)パラダイムを提案する。
我々は,基地局(BS)とモバイルデバイスにゲーティングネットワークと先行するニューラルネットワーク層を配置することにより,LLM内のMoE層を分解する。
我々は、モデルの性能とエンドツーエンドのレイテンシの両方を考慮して、専門家の選択ポリシーを設計する。
論文 参考訳(メタデータ) (2024-05-06T02:55:50Z) - Efficient Multimodal Semantic Segmentation via Dual-Prompt Learning [22.82017440263235]
マルチモーダル(例えば、RGB-Depth/RGB-Thermal)融合は複雑なシーンにおけるセマンティックセグメンテーションを改善する大きな可能性を示している。
既存のアプローチはしばしば、複雑な機能融合戦略を持つデュアルブランチデコーダフレームワークを完全に微調整する。
本稿では、訓練効率の良いマルチモーダルセマンティックセマンティックセグメンテーションのための、驚くほどシンプルで効果的なデュアルプロンプト学習ネットワーク(DPLNet)を提案する。
論文 参考訳(メタデータ) (2023-12-01T05:50:44Z) - Deformable Mixer Transformer with Gating for Multi-Task Learning of
Dense Prediction [126.34551436845133]
CNNとTransformerには独自の利点があり、MTL(Multi-task Learning)の高密度予測に広く使われている。
本稿では,変形可能なCNNと問合せベースのTransformerの長所を共用したMTLモデルを提案する。
論文 参考訳(メタデータ) (2023-08-10T17:37:49Z) - Lightweight Salient Object Detection in Optical Remote-Sensing Images
via Semantic Matching and Edge Alignment [61.45639694373033]
セマンティックマッチングとエッジアライメントに基づく光リモートセンシング画像(ORSI-SOD)のための新しい軽量ネットワークSeaNetを提案する。
具体的には、機能抽出のための軽量MobileNet-V2、高レベルの機能のための動的セマンティックマッチングモジュール(DSMM)、推論のためのポータブルデコーダが含まれる。
論文 参考訳(メタデータ) (2023-01-07T04:33:51Z) - On Jointly Optimizing Partial Offloading and SFC Mapping: A Cooperative
Dual-agent Deep Reinforcement Learning Approach [8.168647937560504]
本稿では,計算可能なMECシステムにおける部分オフロードとSFCマッピング共同最適化(POSMJO)問題について検討する。
目的は、実行遅延、MDのエネルギー消費、エッジコンピューティングの利用料金を組み合わせた長期的な平均コストを最小化することである。
本稿では,協調型二エージェント深部強化学習(CDADRL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-05-20T02:00:53Z) - DS-Net++: Dynamic Weight Slicing for Efficient Inference in CNNs and
Transformers [105.74546828182834]
本稿では,様々な難易度を持つ入力に対して,ネットワークパラメータの一部を適応的にスライスする動的ウェイトスライシングという,ハードウェア効率のよい動的推論方式を示す。
我々は、CNNのフィルタ数とCNNと変換器の多重次元を入力依存的に調整することで、動的スライム可能なネットワーク(DS-Net)と動的スライス可能なネットワーク(DS-Net++)を提案する。
論文 参考訳(メタデータ) (2021-09-21T09:57:21Z) - Full-Duplex Strategy for Video Object Segmentation [141.43983376262815]
Full- Strategy Network (FSNet)はビデオオブジェクトセグメンテーション(VOS)のための新しいフレームワークである
我々のFSNetは、融合復号ステージの前に、クロスモーダルな機能パス(すなわち、送信と受信)を同時に実行します。
我々のFSNetは、VOSとビデオの有能なオブジェクト検出タスクの両方において、他の最先端技術よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-08-06T14:50:50Z) - MSCFNet: A Lightweight Network With Multi-Scale Context Fusion for
Real-Time Semantic Segmentation [27.232578592161673]
マルチスケールコンテキスト融合スキーム(MSCFNet)を用いた新しい軽量ネットワークを考案する。
提案されたMSCFNetは1.15Mパラメータのみを含み、71.9%のMean IoUを実現し、1つのTitan XP GPU構成で50 FPS以上で実行できる。
論文 参考訳(メタデータ) (2021-03-24T08:28:26Z) - MTP: Multi-Task Pruning for Efficient Semantic Segmentation Networks [32.84644563020912]
セマンティックセグメンテーションネットワークのためのマルチタスクチャネルプルーニング手法を提案する。
各畳み込みフィルタの重要性は、任意の層のチャネルを分類と分割タスクによって同時に決定する。
いくつかのベンチマークによる実験結果は、最先端の刈り取り法よりも提案アルゴリズムの方が優れていることを示している。
論文 参考訳(メタデータ) (2020-07-16T15:03:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。