論文の概要: Latent Diffusion Model Based Denoising Receiver for 6G Semantic Communication: From Stochastic Differential Theory to Application
- arxiv url: http://arxiv.org/abs/2506.05710v3
- Date: Thu, 17 Jul 2025 07:26:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-18 13:45:37.41347
- Title: Latent Diffusion Model Based Denoising Receiver for 6G Semantic Communication: From Stochastic Differential Theory to Application
- Title(参考訳): 6Gセマンティック通信のための潜時拡散モデルに基づくDenoising Receiver:確率微分理論から応用まで
- Authors: Xiucheng Wang, Honggang Jia, Nan Cheng,
- Abstract要約: 生成人工知能(GAI)を利用した新しい意味コミュニケーションフレームワークを提案する。
意味的特徴抽出のための変分オートエンコーダを組み合わせた潜在拡散モデル(LDM)に基づくセマンティックコミュニケーションフレームワークを提案する。
提案システムはゼロショットの一般化をサポートし,低SNRおよびアウト・オブ・ディストリビューション条件下での優れた性能を実現する訓練自由フレームワークである。
- 参考スコア(独自算出の注目度): 11.385703484113552
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, a novel semantic communication framework empowered by generative artificial intelligence (GAI) is proposed, to enhance the robustness against both channel noise and transmission data distribution shifts. A theoretical foundation is established using stochastic differential equations (SDEs), from which a closed-form mapping between any signal-to-noise ratio (SNR) and the optimal denoising timestep is derived. Moreover, to address distribution mismatch, a mathematical scaling method is introduced to align received semantic features with the training distribution of the GAI. Built on this theoretical foundation, a latent diffusion model (LDM)-based semantic communication framework is proposed that combines a variational autoencoder for semantic features extraction, where a pretrained diffusion model is used for denoising. The proposed system is a training-free framework that supports zero-shot generalization, and achieves superior performance under low-SNR and out-of-distribution conditions, offering a scalable and robust solution for future 6G semantic communication systems. Experimental results demonstrate that the proposed semantic communication framework achieves state-of-the-art performance in both pixel-level accuracy and semantic perceptual quality, consistently outperforming baselines across a wide range of SNRs and data distributions without any fine-tuning or post-training.
- Abstract(参考訳): 本稿では、チャネルノイズと送信データ分散シフトに対するロバスト性を高めるために、生成人工知能(GAI)によって強化された新しいセマンティックコミュニケーションフレームワークを提案する。
理論的基礎は確率微分方程式 (SDE) を用いて確立され、任意の信号対雑音比 (SNR) と最適分解時間ステップの間の閉形式写像が導出される。
さらに、分布ミスマッチに対処するために、受信した意味的特徴をGAIのトレーニング分布と整合させる数学的スケーリング手法を導入する。
この理論の基礎の上に構築された潜在拡散モデル(LDM)に基づくセマンティック・コミュニケーション・フレームワークは,事前学習した拡散モデルを用いて,意味的特徴抽出のための変分オートエンコーダを組み合わせたものである。
提案システムは、ゼロショットの一般化をサポートし、低SNRおよびアウト・オブ・ディストリビューション条件下での優れた性能を実現し、将来の6Gセマンティック通信システムにスケーラブルで堅牢なソリューションを提供する。
実験により,提案するセマンティック・コミュニケーション・フレームワークは,画素レベルの精度とセマンティック・パーセプティカル・クオリティの両面において最先端の性能を達成し,微調整や後処理を行なわずに,広範囲のSNRやデータ分布のベースラインを一貫して上回ることを示す。
関連論文リスト
- RIS-aided Latent Space Alignment for Semantic Channel Equalization [10.555901476981923]
我々は,無線通信において,厳密なビットレベルの精度を保証するのではなく,意図した意味を伝達することに焦点を当てた新しいパラダイムを導入する。
これらのシステムは、しばしばデータから直接意味を学習し、エンコードするためにディープニューラルネットワーク(DNN)に依存しており、より効率的な通信を可能にしている。
本研究では、再構成可能なインテリジェントサーフェス(RIS)の存在を利用する物理・意味チャネル等化フレームワークを提案する。
提案手法は, 様々なシナリオや無線チャネル条件において, 従来型, 意味的, 意味的, 意味的チャネル等化へのアプローチを一貫して上回っていることを示す。
論文 参考訳(メタデータ) (2025-07-22T10:51:35Z) - Distributionally Robust Wireless Semantic Communication with Large AI Models [120.29419104482793]
6G無線システムは、超低レイテンシで大量のデータをサポートすることが期待されている。
従来のビットレベルの伝送戦略は、現代的なデータ集約型アプリケーションに必要な効率と適応性をサポートできない。
セマンティックコミュニケーション(SemCom)の概念は、生データの代わりにタスク関連セマンティック情報を伝達することに集中することで、この制限に対処する。
論文 参考訳(メタデータ) (2025-05-28T04:03:57Z) - Consistent World Models via Foresight Diffusion [56.45012929930605]
我々は、一貫した拡散に基づく世界モデルを学習する上で重要なボトルネックは、最適下予測能力にあると主張している。
本稿では,拡散に基づく世界モデリングフレームワークであるForesight Diffusion(ForeDiff)を提案する。
論文 参考訳(メタデータ) (2025-05-22T10:01:59Z) - Generative Latent Neural PDE Solver using Flow Matching [8.397730500554047]
低次元の潜伏空間にPDE状態を埋め込んだPDEシミュレーションのための潜伏拡散モデルを提案する。
我々のフレームワークは、オートエンコーダを使用して、異なるタイプのメッシュを統一された構造化潜在グリッドにマッピングし、複雑なジオメトリをキャプチャします。
数値実験により,提案モデルは,精度と長期安定性の両方において,決定論的ベースラインよりも優れていた。
論文 参考訳(メタデータ) (2025-03-28T16:44:28Z) - DiffATR: Diffusion-based Generative Modeling for Audio-Text Retrieval [49.076590578101985]
ノイズから関節分布を生成する拡散型ATRフレームワーク(DiffATR)を提案する。
優れたパフォーマンスを持つAudioCapsとClothoデータセットの実験は、我々のアプローチの有効性を検証する。
論文 参考訳(メタデータ) (2024-09-16T06:33:26Z) - Diffusion-Driven Semantic Communication for Generative Models with Bandwidth Constraints [66.63250537475973]
本稿では,帯域制限付き生成モデルのための,高度なVAEベースの圧縮を用いた拡散駆動型セマンティック通信フレームワークを提案する。
実験の結果,ピーク信号対雑音比 (PSNR) などの画素レベルの指標と,LPIPS (Learning Perceptual Image patch similarity) のような意味的指標が大幅に改善された。
論文 参考訳(メタデータ) (2024-07-26T02:34:25Z) - Latent Diffusion Model-Enabled Low-Latency Semantic Communication in the Presence of Semantic Ambiguities and Wireless Channel Noises [18.539501941328393]
本稿では,ソースデータのアウトレイラを処理するために,遅延拡散モデルを用いたSemComシステムを開発した。
軽量な単層遅延空間変換アダプタは、送信機でのワンショット学習を完了させる。
終端整合蒸留法を用いて, 潜時空間で訓練した拡散模型を蒸留する。
論文 参考訳(メタデータ) (2024-06-09T23:39:31Z) - Fundamental Limitation of Semantic Communications: Neural Estimation for
Rate-Distortion [19.615466425874402]
本稿では,離散メモリレスチャネル上でのセマンティック通信の基本的な限界について検討する。
我々は,最小圧縮率,観測歪み,意味歪み,チャネル容量の関係を調べるために,意味速度歪み関数(SRDF)を採用した。
論文 参考訳(メタデータ) (2024-01-02T12:10:16Z) - Conditional Denoising Diffusion Probabilistic Models for Data Reconstruction Enhancement in Wireless Communications [12.218161437914118]
無線チャネル上でのデータ伝送と再構成を強化するために,条件付き拡散確率モデル(DDPM)を提案する。
これに触発された鍵となる考え方は、情報信号の「ノイズからクリーン」変換を学ぶ際に、拡散モデルの生成的先行性を活用することである。
提案手法は,情報内容の事前知識が利用可能な通信シナリオに有効である。
論文 参考訳(メタデータ) (2023-10-30T11:33:01Z) - Adversarial Training of Denoising Diffusion Model Using Dual
Discriminators for High-Fidelity Multi-Speaker TTS [0.0]
拡散モデルは確率論的アプローチにより高品質なデータを生成することができる。
これは、多くの時間ステップを必要とするため、生成速度が遅くなるという欠点に悩まされる。
本稿では、逆過程の分布を学習する拡散判別器と、生成されたデータの分布を学習するスペクトログラム判別器の2つの識別器を用いた音声合成モデルを提案する。
論文 参考訳(メタデータ) (2023-08-03T07:22:04Z) - PDE+: Enhancing Generalization via PDE with Adaptive Distributional
Diffusion [66.95761172711073]
ニューラルネットワークの一般化は、機械学習における中心的な課題です。
本稿では、入力データを調整することに集中するのではなく、ニューラルネットワークの基盤機能を直接拡張することを提案する。
私たちはこの理論的フレームワークを、$textbfPDE+$$textbfPDE$ with $textbfA$daptive $textbfD$istributional $textbfD$iffusionとして実践しました。
論文 参考訳(メタデータ) (2023-05-25T08:23:26Z) - Joint Task and Data Oriented Semantic Communications: A Deep Separate
Source-channel Coding Scheme [17.4244108919728]
データ伝達とセマンティックタスクの両方に役立てるために、共同データ圧縮とセマンティック分析がセマンティックコミュニケーションにおいて重要な問題となっている。
本稿では,共同作業とデータ指向のセマンティックコミュニケーションのためのディープ・ソースチャネル・コーディング・フレームワークを提案する。
深層学習モデルの過度な問題に対処するために,反復学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-27T08:34:37Z) - Semantic Image Synthesis via Diffusion Models [174.24523061460704]
Denoising Diffusion Probabilistic Models (DDPM) は様々な画像生成タスクにおいて顕著な成功を収めた。
セマンティック画像合成に関する最近の研究は、主に事実上のGANベースのアプローチに従っている。
意味画像合成のためのDDPMに基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-30T18:31:51Z) - Influence Estimation and Maximization via Neural Mean-Field Dynamics [60.91291234832546]
本稿では,ニューラル平均場(NMF)ダイナミクスを用いた新しい学習フレームワークを提案する。
我々のフレームワークは拡散ネットワークの構造とノード感染確率の進化を同時に学習することができる。
論文 参考訳(メタデータ) (2021-06-03T00:02:05Z) - Network Diffusions via Neural Mean-Field Dynamics [52.091487866968286]
本稿では,ネットワーク上の拡散の推論と推定のための新しい学習フレームワークを提案する。
本研究の枠組みは, ノード感染確率の正確な進化を得るために, モリ・ズワンジッヒ形式から導かれる。
我々のアプローチは、基礎となる拡散ネットワークモデルのバリエーションに対して多用途で堅牢である。
論文 参考訳(メタデータ) (2020-06-16T18:45:20Z) - Stochastic-Sign SGD for Federated Learning with Theoretical Guarantees [49.91477656517431]
量子化に基づく解法は、フェデレートラーニング(FL)において広く採用されている。
上記のプロパティをすべて享受する既存のメソッドはありません。
本稿では,SIGNSGDに基づく直感的かつ理論的に簡易な手法を提案し,そのギャップを埋める。
論文 参考訳(メタデータ) (2020-02-25T15:12:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。