論文の概要: SC-CDM: Enhancing Quality of Image Semantic Communication with a Compact Diffusion Model
- arxiv url: http://arxiv.org/abs/2410.02121v1
- Date: Thu, 3 Oct 2024 01:01:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-04 08:35:44.809606
- Title: SC-CDM: Enhancing Quality of Image Semantic Communication with a Compact Diffusion Model
- Title(参考訳): SC-CDM:コンパクト拡散モデルによる画像意味コミュニケーションの品質向上
- Authors: Kexin Zhang, Lixin Li, Wensheng Lin, Yuna Yan, Wenchi Cheng, Zhu Han,
- Abstract要約: 無線画像伝送のための生成SC(SC-CDM)を提案する。
我々は,Swin Transformerを効率的な意味的特徴抽出と圧縮のための新しいバックボーンとして再設計することを目指している。
我々はさらに、CNNベースのDeepJSCC上でPak Signal-to-Noise Ratio(PSNR)を17%以上増加させます。
- 参考スコア(独自算出の注目度): 27.462224078883786
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic Communication (SC) is an emerging technology that has attracted much attention in the sixth-generation (6G) mobile communication systems. However, few literature has fully considered the perceptual quality of the reconstructed image. To solve this problem, we propose a generative SC for wireless image transmission (denoted as SC-CDM). This approach leverages compact diffusion models to improve the fidelity and semantic accuracy of the images reconstructed after transmission, ensuring that the essential content is preserved even in bandwidth-constrained environments. Specifically, we aim to redesign the swin Transformer as a new backbone for efficient semantic feature extraction and compression. Next, the receiver integrates the slim prior and image reconstruction networks. Compared to traditional Diffusion Models (DMs), it leverages DMs' robust distribution mapping capability to generate a compact condition vector, guiding image recovery, thus enhancing the perceptual details of the reconstructed images. Finally, a series of evaluation and ablation studies are conducted to validate the effectiveness and robustness of the proposed algorithm and further increase the Peak Signal-to-Noise Ratio (PSNR) by over 17% on top of CNN-based DeepJSCC.
- Abstract(参考訳): セマンティックコミュニケーション(SC)は,第6世代(6G)モバイル通信システムにおいて注目されている新興技術である。
しかし、再建された像の知覚的品質を十分に考慮した文献はほとんどない。
そこで本研究では,無線画像伝送のための生成SC(SC-CDM)を提案する。
このアプローチは、コンパクトな拡散モデルを活用し、伝送後に再構成された画像の忠実度と意味的精度を改善し、帯域幅に制約のある環境でも本質的な内容が保存されることを保証する。
具体的には、スウィントランスフォーマーを効率的な意味的特徴抽出と圧縮のための新しいバックボーンとして再設計することを目指している。
次に、受信機はスリム先行と画像再構成ネットワークを統合する。
従来の拡散モデル(DM)と比較して、DMの頑健な分布マッピング機能を活用して、コンパクトな条件ベクトルを生成し、画像回復を導くことにより、再構成された画像の知覚的詳細性を高める。
最後に、提案アルゴリズムの有効性とロバスト性を検証し、さらにCNNベースのDeepJSCC上でピーク信号対雑音比(PSNR)を17%以上向上させるための一連の評価およびアブレーション研究を行った。
関連論文リスト
- Semantic Successive Refinement: A Generative AI-aided Semantic Communication Framework [27.524671767937512]
本稿では,単一ユーザシナリオを対象とした新しいジェネレーティブAIセマンティックコミュニケーション(GSC)システムを提案する。
送信側では、Swin Transformerをベースとしたジョイントソースチャネル符号化機構を用いて、効率的なセマンティック特徴抽出を行う。
受信側では、高度な拡散モデル(DM)が劣化した信号から高品質な画像を再構成し、知覚の詳細を高める。
論文 参考訳(メタデータ) (2024-07-31T06:08:51Z) - Binarized Diffusion Model for Image Super-Resolution [61.963833405167875]
超圧縮アルゴリズムであるバイナリ化は、高度な拡散モデル(DM)を効果的に加速する可能性を提供する
既存の二項化法では性能が著しく低下する。
画像SRのための新しいバイナライズ拡散モデルBI-DiffSRを提案する。
論文 参考訳(メタデータ) (2024-06-09T10:30:25Z) - Deep Joint Semantic Coding and Beamforming for Near-Space Airship-Borne Massive MIMO Network [70.63240823677182]
近距離飛行船搭載通信網は、緊急に信頼性と効率のよい飛行船対Xリンクを必要とする。
本稿では,MIMO(Multiple-Input multiple-output)技術とセマンティックコミュニケーションを統合することを提案する。
論文 参考訳(メタデータ) (2024-05-30T09:46:59Z) - MsDC-DEQ-Net: Deep Equilibrium Model (DEQ) with Multi-scale Dilated
Convolution for Image Compressive Sensing (CS) [0.0]
圧縮センシング(CS)は、従来のサンプリング法よりも少ない測定値を用いてスパース信号の回復を可能にする技術である。
我々はCSを用いた自然画像再構成のための解釈可能かつ簡潔なニューラルネットワークモデルを構築した。
MsDC-DEQ-Netと呼ばれるこのモデルは、最先端のネットワークベースの手法と比較して、競争力のある性能を示す。
論文 参考訳(メタデータ) (2024-01-05T16:25:58Z) - JoReS-Diff: Joint Retinex and Semantic Priors in Diffusion Model for Low-light Image Enhancement [69.6035373784027]
低照度画像強調(LLIE)は条件付き拡散モデルを用いて有望な性能を実現している。
従来手法は、タスク固有の条件戦略の十分な定式化の重要性を無視するものであった。
本稿では,Retinex および semantic-based pre-processing condition を付加した新しいアプローチである JoReS-Diff を提案する。
論文 参考訳(メタデータ) (2023-12-20T08:05:57Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - A Relay System for Semantic Image Transmission based on Shared Feature
Extraction and Hyperprior Entropy Compression [10.094327559669859]
本稿では,共有特徴抽出と高次エントロピー圧縮に基づく意味的画像伝達のための中継通信ネットワークを提案する。
実験により,他の研究手法と比較して,提案方式は伝送オーバーヘッドが低く,セマンティック画像伝送性能も高いことがわかった。
論文 参考訳(メタデータ) (2023-11-17T12:45:30Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - CommIN: Semantic Image Communications as an Inverse Problem with
INN-Guided Diffusion Models [20.005671042281246]
劣化した再構成画像からの高品質なソース画像の復元を逆問題とするComminを提案する。
極端条件下でのDeepJSCCと比較して,コミンは知覚品質を著しく向上させることが示された。
論文 参考訳(メタデータ) (2023-10-02T12:06:58Z) - Perceptual Learned Source-Channel Coding for High-Fidelity Image
Semantic Transmission [7.692038874196345]
本稿では, 深部JSCCの最適化のために, 対向損失を導入する。
我々の新しい深層JSCCアーキテクチャは、エンコーダ、無線チャネル、デコーダ/ジェネレータ、および識別器を組み合わせたものである。
ユーザスタディでは、知覚的に類似したエンドツーエンドの画像伝送品質を達成することで、約50%の無線チャネル帯域幅コストを節約できることを確認した。
論文 参考訳(メタデータ) (2022-05-26T03:05:13Z) - Adaptive Information Bottleneck Guided Joint Source and Channel Coding
for Image Transmission [132.72277692192878]
画像伝送には適応情報ボトルネック(IB)誘導ジョイントソースとチャネル符号化(AIB-JSCC)が提案されている。
AIB-JSCCの目的は、画像再構成品質を改善しながら伝送速度を下げることである。
実験の結果,AIB-JSCCは送信データ量を大幅に削減し,再現性を向上させることができることがわかった。
論文 参考訳(メタデータ) (2022-03-12T17:44:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。