Fugu-MT 論文翻訳(概要): Semantic Successive Refinement: A Generative AI-aided Semantic Communication Framework

論文の概要: Semantic Successive Refinement: A Generative AI-aided Semantic Communication Framework

arxiv url: http://arxiv.org/abs/2408.05112v1
Date: Wed, 31 Jul 2024 06:08:51 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-19 04:16:58.034308
Title: Semantic Successive Refinement: A Generative AI-aided Semantic Communication Framework
Title（参考訳）: Semantic Semantic Refinement: ジェネレーティブなAI支援セマンティックコミュニケーションフレームワーク
Authors: Kexin Zhang, Lixin Li, Wensheng Lin, Yuna Yan, Rui Li, Wenchi Cheng, Zhu Han,
Abstract要約: 本稿では,単一ユーザシナリオを対象とした新しいジェネレーティブAIセマンティックコミュニケーション(GSC)システムを提案する。送信側では、Swin Transformerをベースとしたジョイントソースチャネル符号化機構を用いて、効率的なセマンティック特徴抽出を行う。受信側では、高度な拡散モデル(DM)が劣化した信号から高品質な画像を再構成し、知覚の詳細を高める。
参考スコア（独自算出の注目度）: 27.524671767937512
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Semantic Communication (SC) is an emerging technology aiming to surpass the Shannon limit. Traditional SC strategies often minimize signal distortion between the original and reconstructed data, neglecting perceptual quality, especially in low Signal-to-Noise Ratio (SNR) environments. To address this issue, we introduce a novel Generative AI Semantic Communication (GSC) system for single-user scenarios. This system leverages deep generative models to establish a new paradigm in SC. Specifically, At the transmitter end, it employs a joint source-channel coding mechanism based on the Swin Transformer for efficient semantic feature extraction and compression. At the receiver end, an advanced Diffusion Model (DM) reconstructs high-quality images from degraded signals, enhancing perceptual details. Additionally, we present a Multi-User Generative Semantic Communication (MU-GSC) system utilizing an asynchronous processing model. This model effectively manages multiple user requests and optimally utilizes system resources for parallel processing. Simulation results on public datasets demonstrate that our generative AI semantic communication systems achieve superior transmission efficiency and enhanced communication content quality across various channel conditions. Compared to CNN-based DeepJSCC, our methods improve the Peak Signal-to-Noise Ratio (PSNR) by 17.75% in Additive White Gaussian Noise (AWGN) channels and by 20.86% in Rayleigh channels.
Abstract（参考訳）: Semantic Communication (SC)は、シャノン限界を超えることを目的とした新興技術である。従来のSC戦略は、オリジナルのデータと再構成されたデータの間の信号歪みを最小限に抑え、特にSNR(Signal-to-Noise Ratio)の低い環境での知覚的品質を無視する。この問題に対処するために、単一ユーザシナリオのための新しいジェネレーティブAIセマンティックコミュニケーション(GSC)システムを導入する。このシステムは、SCで新しいパラダイムを確立するために、深層生成モデルを活用する。具体的には、送信側でSwin Transformerをベースとしたジョイントソースチャネル符号化機構を用いて、効率的なセマンティック特徴抽出と圧縮を行う。受信側では、高度な拡散モデル(DM)が劣化した信号から高品質な画像を再構成し、知覚の詳細を高める。さらに,非同期処理モデルを用いたMulti-User Generative Semantic Communication (MU-GSC)システムを提案する。このモデルは、複数のユーザ要求を効果的に管理し、並列処理にシステムリソースを最適に利用する。公開データセット上でのシミュレーション結果から,我々の生成AIセマンティックコミュニケーションシステムは,伝送効率が向上し,通信内容の質が向上することを示した。 CNNをベースとしたDeepJSCCと比較して,Pak Signal-to-Noise Ratio(PSNR)はAWGN(Additive White Gaussian Noise)チャネルで17.75%,Rayleighチャネルで20.86%向上した。

関連論文リスト

Scenario-Adaptive MU-MIMO OFDM Semantic Communication With Asymmetric Neural Network [1.8534178102035817]
ダウンリンク伝送に適した非対称アーキテクチャを備えたシナリオ適応型MU-MIMOSemComフレームワークを提案する。送信機では,チャネル状態情報(CSI)とSNR(Signal-to-Noise Ratio)に基づいて動的に特徴抽出を行うシナリオ対応セマンティックエンコーダを導入する。受信機において、新規なパイロット誘導注意機構を備えた軽量デコーダを用いて、チャネル等化及び特徴校正を暗黙的に行う。
論文参考訳（メタデータ） (2026-02-14T02:15:25Z)
Joint Source-Channel-Generation Coding: From Distortion-oriented Reconstruction to Semantic-consistent Generation [58.67925548779465]
本稿では,知覚的再構成から確率的生成へ焦点を移す新しいパラダイムとして,JSCGC(Joint Source-Channel-Generation Coding)を提案する。 JSCGCは意味的品質と意味的忠実性を大幅に改善し、従来の歪み指向J SCC法よりも大幅に向上する。
論文参考訳（メタデータ） (2026-01-19T08:12:47Z)
Large-Scale Model Enabled Semantic Communication Based on Robust Knowledge Distillation [53.16213723669751]
大規模モデル(LSM)は意味表現と理解に有効なフレームワークである。しかしながら、それらの直接的なデプロイメントは、しばしば高い計算複雑性とリソース要求によって妨げられる。本稿では,新しい知識蒸留に基づくセマンティックコミュニケーションフレームワークを提案する。
論文参考訳（メタデータ） (2025-08-04T07:47:18Z)
Channel-adaptive Cross-modal Generative Semantic Communication for Point Cloud Transmission [31.144719637429567]
我々は,GenSeC-PC と呼ばれる PC 伝送のためのクロスモーダル・ジェネリック・セマンティック・コミュニケーション (SemCom) を提案する。 GenSeC-PCは、画像と点雲を融合させるセマンティックエンコーダを使用し、画像は非送信側情報として機能する。そこで我々は,ロバスト伝送とシステム複雑性の低減を図るために,合理化・非対称なチャネル適応型共同セマンティックチャネル符号化アーキテクチャを設計する。
論文参考訳（メタデータ） (2025-06-03T01:14:58Z)
Plug-and-Play AMC: Context Is King in Training-Free, Open-Set Modulation with LLMs [22.990537822143907]
自動変調分類(AMC)は、効率的なスペクトル管理とロバストな無線通信において重要である。本稿では,従来の信号処理技術と大規模言語モデルを統合する革新的なフレームワークを提案する。この研究は、次世代無線ネットワークにおけるスケーラブルで解釈可能で汎用的な信号分類システムの基礎を築いた。
論文参考訳（メタデータ） (2025-05-06T02:07:47Z)
SING: Semantic Image Communications using Null-Space and INN-Guided Diffusion Models [52.40011613324083]
近年, 無線画像伝送において, 共用音源チャネル符号化システム (DeepJSCC) が顕著な性能を発揮している。既存の手法では、送信された画像とレシーバーの再構成されたバージョンとの間の歪みを最小限に抑えることに重点を置いており、しばしば知覚的品質を見落としている。逆問題として,破損した再構成画像から高品質な画像の復元を定式化する新しいフレームワークであるSINGを提案する。
論文参考訳（メタデータ） (2025-03-16T12:32:11Z)
Generative Video Semantic Communication via Multimodal Semantic Fusion with Large Model [55.71885688565501]
本稿では,高品質な映像再構成を実現するために,意味情報を抽出し,送信するスケーラブルなビデオ意味コミュニケーションフレームワークを提案する。具体的には、送信機では、それぞれテキストと構造的意味論として機能するソースビデオから記述と他の条件信号を抽出する。受信機では、拡散に基づくGenAI大モデルを用いて、ビデオの再構成のために複数のモーダルのセマンティクスを融合させる。
論文参考訳（メタデータ） (2025-02-19T15:59:07Z)
Large Generative Model-assisted Talking-face Semantic Communication System [55.42631520122753]
本研究では,LGM-TSC(Large Generative Model-assisted Talking-face Semantic Communication)システムを提案する。送信機のジェネレーティブセマンティック・エクストラクタ(GSE)は、意味的にスパースな音声映像を高情報密度のテキストに変換する。意味的曖昧さと修正のためのLarge Language Model (LLM)に基づくPrivate Knowledge Base (KB)。 BERT-VITS2とSadTalkerモデルを用いた生成意味再構成(GSR)により、テキストを高QoE音声ビデオに変換する。
論文参考訳（メタデータ） (2024-11-06T12:45:46Z)
SC-CDM: Enhancing Quality of Image Semantic Communication with a Compact Diffusion Model [27.462224078883786]
無線画像伝送のための生成SC(SC-CDM)を提案する。我々は,Swin Transformerを効率的な意味的特徴抽出と圧縮のための新しいバックボーンとして再設計することを目指している。我々はさらに、CNNベースのDeepJSCC上でPak Signal-to-Noise Ratio(PSNR)を17%以上増加させます。
論文参考訳（メタデータ） (2024-10-03T01:01:04Z)
Diffusion-Driven Semantic Communication for Generative Models with Bandwidth Constraints [27.049330099874396]
本稿では,帯域制限付き生成モデルのための,高度なVAEベースの圧縮を用いた拡散駆動型セマンティック通信フレームワークを提案する。実験の結果,ピーク信号対雑音比 (PSNR) などの画素レベルの指標と,LPIPS (Learning Perceptual Image patch similarity) のような意味的指標が大幅に改善された。
論文参考訳（メタデータ） (2024-07-26T02:34:25Z)
Latent Diffusion Model-Enabled Real-Time Semantic Communication Considering Semantic Ambiguities and Channel Noises [18.539501941328393]
本稿では, 遅延拡散モデル対応SemComシステムを構築し, 既存システムと比較して3つの改良点を提案する。軽量な単層遅延空間変換アダプタは、送信機でのワンショット学習を完了させる。終端整合蒸留法を用いて, 潜時空間で訓練した拡散模型を蒸留する。
論文参考訳（メタデータ） (2024-06-09T23:39:31Z)
Communication-Efficient Framework for Distributed Image Semantic Wireless Transmission [68.69108124451263]
IoTデバイスを用いたマルチタスク分散画像伝送のためのFederated Learning-based semantic communication (FLSC)フレームワーク。各リンクは階層型視覚変換器(HVT)ベースの抽出器とタスク適応トランスレータで構成される。チャネル状態情報に基づく多重出力多重出力伝送モジュール。
論文参考訳（メタデータ） (2023-08-07T16:32:14Z)
Causal Semantic Communication for Digital Twins: A Generalizable Imitation Learning Approach [74.25870052841226]
デジタルツイン(DT)は、物理世界の仮想表現と通信(例えば6G)、コンピュータ、人工知能(AI)技術を活用して、多くの接続されたインテリジェンスサービスを実現する。無線システムは、厳密な通信制約下での情報意思決定を容易にするために意味コミュニケーション(SC)のパラダイムを利用することができる。 DTベースの無線システムでは,因果意味通信(CSC)と呼ばれる新しいフレームワークが提案されている。
論文参考訳（メタデータ） (2023-04-25T00:15:00Z)
Perceptual Learned Source-Channel Coding for High-Fidelity Image Semantic Transmission [7.692038874196345]
本稿では, 深部JSCCの最適化のために, 対向損失を導入する。我々の新しい深層JSCCアーキテクチャは、エンコーダ、無線チャネル、デコーダ/ジェネレータ、および識別器を組み合わせたものである。ユーザスタディでは、知覚的に類似したエンドツーエンドの画像伝送品質を達成することで、約50%の無線チャネル帯域幅コストを節約できることを確認した。
論文参考訳（メタデータ） (2022-05-26T03:05:13Z)
Model-based Deep Learning Receiver Design for Rate-Splitting Multiple Access [65.21117658030235]
本研究では,モデルベース深層学習(MBDL)に基づく実用的なRSMA受信機の設計を提案する。 MBDL受信機は、符号なしシンボル誤り率(SER)、リンクレベルシミュレーション(LLS)によるスループット性能、平均トレーニングオーバーヘッドの観点から評価される。その結果,MBDLはCSIRが不完全なSIC受信機よりも優れていた。
論文参考訳（メタデータ） (2022-05-02T12:23:55Z)
End-to-End Learning for Uplink MU-SIMO Joint Transmitter and Non-Coherent Receiver Design in Fading Channels [11.182920270301304]
JTRD-Netと呼ばれる新しいエンドツーエンド学習手法が提案され、マルチユーザシングルインプットマルチ出力(MU-SIMO)ジョイントトランスミッタとフェーディングチャネルにおける非コヒーレントレシーバー設計(JTRD)をアップリンクする。送信側は、マルチユーザー波形設計を担当する並列線形層のグループとしてモデル化されています。非コヒーレント受信機は、マルチユーザ検出(MUD)機能を提供するために、ディープフィードフォワードニューラルネットワーク(DFNN)によって形成される。
論文参考訳（メタデータ） (2021-05-04T02:47:59Z)
A Compressive Sensing Approach for Federated Learning over Massive MIMO Communication Systems [82.2513703281725]
フェデレートラーニング(Federated Learning)は、無線デバイスとのコラボレーションによって、中央サーバでグローバルモデルをトレーニングするための、プライバシ保護のアプローチである。本稿では,大規模マルチインプット多出力通信システム上でのフェデレーション学習のための圧縮センシング手法を提案する。
論文参考訳（メタデータ） (2020-03-18T05:56:27Z)
Data-Driven Symbol Detection via Model-Based Machine Learning [117.58188185409904]
機械学習(ML)とモデルベースアルゴリズムを組み合わせた,検出設計のシンボル化を目的とした,データ駆動型フレームワークについてレビューする。このハイブリッドアプローチでは、よく知られたチャネルモデルに基づくアルゴリズムをMLベースのアルゴリズムで拡張し、チャネルモデル依存性を除去する。提案手法は, 正確なチャネル入出力統計関係を知らなくても, モデルベースアルゴリズムのほぼ最適性能が得られることを示す。
論文参考訳（メタデータ） (2020-02-14T06:58:27Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。