Fugu-MT 論文翻訳(概要): SC-CDM: Enhancing Quality of Image Semantic Communication with a Compact Diffusion Model

論文の概要: SC-CDM: Enhancing Quality of Image Semantic Communication with a Compact Diffusion Model

arxiv url: http://arxiv.org/abs/2410.02121v1
Date: Thu, 3 Oct 2024 01:01:04 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-04 08:35:44.809606
Title: SC-CDM: Enhancing Quality of Image Semantic Communication with a Compact Diffusion Model
Title（参考訳）: SC-CDM:コンパクト拡散モデルによる画像意味コミュニケーションの品質向上
Authors: Kexin Zhang, Lixin Li, Wensheng Lin, Yuna Yan, Wenchi Cheng, Zhu Han,
Abstract要約: 無線画像伝送のための生成SC(SC-CDM)を提案する。我々は,Swin Transformerを効率的な意味的特徴抽出と圧縮のための新しいバックボーンとして再設計することを目指している。我々はさらに、CNNベースのDeepJSCC上でPak Signal-to-Noise Ratio(PSNR)を17%以上増加させます。
参考スコア（独自算出の注目度）: 27.462224078883786
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Semantic Communication (SC) is an emerging technology that has attracted much attention in the sixth-generation (6G) mobile communication systems. However, few literature has fully considered the perceptual quality of the reconstructed image. To solve this problem, we propose a generative SC for wireless image transmission (denoted as SC-CDM). This approach leverages compact diffusion models to improve the fidelity and semantic accuracy of the images reconstructed after transmission, ensuring that the essential content is preserved even in bandwidth-constrained environments. Specifically, we aim to redesign the swin Transformer as a new backbone for efficient semantic feature extraction and compression. Next, the receiver integrates the slim prior and image reconstruction networks. Compared to traditional Diffusion Models (DMs), it leverages DMs' robust distribution mapping capability to generate a compact condition vector, guiding image recovery, thus enhancing the perceptual details of the reconstructed images. Finally, a series of evaluation and ablation studies are conducted to validate the effectiveness and robustness of the proposed algorithm and further increase the Peak Signal-to-Noise Ratio (PSNR) by over 17% on top of CNN-based DeepJSCC.
Abstract（参考訳）: セマンティックコミュニケーション(SC)は,第6世代(6G)モバイル通信システムにおいて注目されている新興技術である。しかし、再建された像の知覚的品質を十分に考慮した文献はほとんどない。そこで本研究では,無線画像伝送のための生成SC(SC-CDM)を提案する。このアプローチは、コンパクトな拡散モデルを活用し、伝送後に再構成された画像の忠実度と意味的精度を改善し、帯域幅に制約のある環境でも本質的な内容が保存されることを保証する。具体的には、スウィントランスフォーマーを効率的な意味的特徴抽出と圧縮のための新しいバックボーンとして再設計することを目指している。次に、受信機はスリム先行と画像再構成ネットワークを統合する。従来の拡散モデル(DM)と比較して、DMの頑健な分布マッピング機能を活用して、コンパクトな条件ベクトルを生成し、画像回復を導くことにより、再構成された画像の知覚的詳細性を高める。最後に、提案アルゴリズムの有効性とロバスト性を検証し、さらにCNNベースのDeepJSCC上でピーク信号対雑音比(PSNR)を17%以上向上させるための一連の評価およびアブレーション研究を行った。

関連論文リスト

Joint Source-Channel-Generation Coding: From Distortion-oriented Reconstruction to Semantic-consistent Generation [58.67925548779465]
本稿では,知覚的再構成から確率的生成へ焦点を移す新しいパラダイムとして,JSCGC(Joint Source-Channel-Generation Coding)を提案する。 JSCGCは意味的品質と意味的忠実性を大幅に改善し、従来の歪み指向J SCC法よりも大幅に向上する。
論文参考訳（メタデータ） (2026-01-19T08:12:47Z)
Generative imaging for radio interferometry with fast uncertainty quantification [4.294714866547824]
学習可能な再構築手法は、効率的で高品質な再構築を実現する上で有望である。本稿では,後部分布の効率的な近似サンプリングを可能にする生成ニューラルネットワークの利用について検討する。本手法は,次世代電波望遠鏡の計算効率,拡張性,不確実性に配慮した画像化に向けた重要なステップを提供する。
論文参考訳（メタデータ） (2025-07-28T18:52:07Z)
Higher fidelity perceptual image and video compression with a latent conditioned residual denoising diffusion model [55.2480439325792]
本稿では,認知品質に最適化されたハイブリッド圧縮方式を提案し,CDCモデルのアプローチをデコーダネットワークで拡張する。 CDCと比較した場合,LPIPSとFIDの知覚スコアを比較検討しながら,最大2dBPSNRの忠実度向上を実現した。
論文参考訳（メタデータ） (2025-05-19T14:13:14Z)
Channel Fingerprint Construction for Massive MIMO: A Deep Conditional Generative Approach [65.47969413708344]
CF双生児の概念を導入し、条件付き生成拡散モデル(CGDM)を設計する。本研究では, 粗粒CFに条件付き観測された細粒CFの対数分布に対するエビデンスローバウンド(ELBO)を導出するために, 変分推論手法を用いる。提案手法は, ベースラインと比較して, 復元性能が著しく向上していることを示す。
論文参考訳（メタデータ） (2025-05-12T01:36:06Z)
SING: Semantic Image Communications using Null-Space and INN-Guided Diffusion Models [52.40011613324083]
近年, 無線画像伝送において, 共用音源チャネル符号化システム (DeepJSCC) が顕著な性能を発揮している。既存の手法では、送信された画像とレシーバーの再構成されたバージョンとの間の歪みを最小限に抑えることに重点を置いており、しばしば知覚的品質を見落としている。逆問題として,破損した再構成画像から高品質な画像の復元を定式化する新しいフレームワークであるSINGを提案する。
論文参考訳（メタデータ） (2025-03-16T12:32:11Z)
InterLCM: Low-Quality Images as Intermediate States of Latent Consistency Models for Effective Blind Face Restoration [106.70903819362402]
拡散前駆体は、低画質画像の復元のために、復元データセットの微細調整拡散モデル(DM)によってブラインドフェイス復元(BFR)に使用されている。我々は,その優れたセマンティック一貫性と効率のために潜在一貫性モデル(LCM)を活用するために,InterLCMを提案する。 InterLCMは、合成データセットと実世界のデータセットの両方において既存のアプローチより優れており、推論速度も高速である。
論文参考訳（メタデータ） (2025-02-04T10:51:20Z)
Semantic Successive Refinement: A Generative AI-aided Semantic Communication Framework [27.524671767937512]
本稿では,単一ユーザシナリオを対象とした新しいジェネレーティブAIセマンティックコミュニケーション(GSC)システムを提案する。送信側では、Swin Transformerをベースとしたジョイントソースチャネル符号化機構を用いて、効率的なセマンティック特徴抽出を行う。受信側では、高度な拡散モデル(DM)が劣化した信号から高品質な画像を再構成し、知覚の詳細を高める。
論文参考訳（メタデータ） (2024-07-31T06:08:51Z)
Diffusion-Driven Semantic Communication for Generative Models with Bandwidth Constraints [66.63250537475973]
本稿では,帯域制限付き生成モデルのための,高度なVAEベースの圧縮を用いた拡散駆動型セマンティック通信フレームワークを提案する。実験の結果,ピーク信号対雑音比 (PSNR) などの画素レベルの指標と,LPIPS (Learning Perceptual Image patch similarity) のような意味的指標が大幅に改善された。
論文参考訳（メタデータ） (2024-07-26T02:34:25Z)
Binarized Diffusion Model for Image Super-Resolution [61.963833405167875]
超圧縮アルゴリズムであるバイナリ化は、高度な拡散モデル(DM)を効果的に加速する可能性を提供する既存の二項化法では性能が著しく低下する。画像SRのための新しいバイナライズ拡散モデルBI-DiffSRを提案する。
論文参考訳（メタデータ） (2024-06-09T10:30:25Z)
Deep Joint Semantic Coding and Beamforming for Near-Space Airship-Borne Massive MIMO Network [70.63240823677182]
近距離飛行船搭載通信網は、緊急に信頼性と効率のよい飛行船対Xリンクを必要とする。本稿では,MIMO(Multiple-Input multiple-output)技術とセマンティックコミュニケーションを統合することを提案する。
論文参考訳（メタデータ） (2024-05-30T09:46:59Z)
MsDC-DEQ-Net: Deep Equilibrium Model (DEQ) with Multi-scale Dilated Convolution for Image Compressive Sensing (CS) [0.0]
圧縮センシング(CS)は、従来のサンプリング法よりも少ない測定値を用いてスパース信号の回復を可能にする技術である。我々はCSを用いた自然画像再構成のための解釈可能かつ簡潔なニューラルネットワークモデルを構築した。 MsDC-DEQ-Netと呼ばれるこのモデルは、最先端のネットワークベースの手法と比較して、競争力のある性能を示す。
論文参考訳（メタデータ） (2024-01-05T16:25:58Z)
JoReS-Diff: Joint Retinex and Semantic Priors in Diffusion Model for Low-light Image Enhancement [69.6035373784027]
低照度画像強調(LLIE)は条件付き拡散モデルを用いて有望な性能を実現している。従来手法は、タスク固有の条件戦略の十分な定式化の重要性を無視するものであった。本稿では,Retinex および semantic-based pre-processing condition を付加した新しいアプローチである JoReS-Diff を提案する。
論文参考訳（メタデータ） (2023-12-20T08:05:57Z)
DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。 MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文参考訳（メタデータ） (2023-12-11T18:38:28Z)
A Relay System for Semantic Image Transmission based on Shared Feature Extraction and Hyperprior Entropy Compression [10.094327559669859]
本稿では,共有特徴抽出と高次エントロピー圧縮に基づく意味的画像伝達のための中継通信ネットワークを提案する。実験により,他の研究手法と比較して,提案方式は伝送オーバーヘッドが低く,セマンティック画像伝送性能も高いことがわかった。
論文参考訳（メタデータ） (2023-11-17T12:45:30Z)
Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。 CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。 DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文参考訳（メタデータ） (2023-10-11T12:46:11Z)
CommIN: Semantic Image Communications as an Inverse Problem with INN-Guided Diffusion Models [20.005671042281246]
劣化した再構成画像からの高品質なソース画像の復元を逆問題とするComminを提案する。極端条件下でのDeepJSCCと比較して,コミンは知覚品質を著しく向上させることが示された。
論文参考訳（メタデータ） (2023-10-02T12:06:58Z)
Perceptual Learned Source-Channel Coding for High-Fidelity Image Semantic Transmission [7.692038874196345]
本稿では, 深部JSCCの最適化のために, 対向損失を導入する。我々の新しい深層JSCCアーキテクチャは、エンコーダ、無線チャネル、デコーダ/ジェネレータ、および識別器を組み合わせたものである。ユーザスタディでは、知覚的に類似したエンドツーエンドの画像伝送品質を達成することで、約50%の無線チャネル帯域幅コストを節約できることを確認した。
論文参考訳（メタデータ） (2022-05-26T03:05:13Z)
Adaptive Information Bottleneck Guided Joint Source and Channel Coding for Image Transmission [132.72277692192878]
画像伝送には適応情報ボトルネック(IB)誘導ジョイントソースとチャネル符号化(AIB-JSCC)が提案されている。 AIB-JSCCの目的は、画像再構成品質を改善しながら伝送速度を下げることである。実験の結果,AIB-JSCCは送信データ量を大幅に削減し,再現性を向上させることができることがわかった。
論文参考訳（メタデータ） (2022-03-12T17:44:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。