論文の概要: Optimally Bridging Semantics and Data: Generative Semantic Communication via Schrödinger Bridge
- arxiv url: http://arxiv.org/abs/2604.17802v1
- Date: Mon, 20 Apr 2026 04:49:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.695415
- Title: Optimally Bridging Semantics and Data: Generative Semantic Communication via Schrödinger Bridge
- Title(参考訳): 最適意味論とデータ:シュレーディンガー橋による生成意味論コミュニケーション
- Authors: Dahua Gao, Ruichao Liu, Minxi Yang, Shuai Ma, Youlong Wu, Guangming Shi,
- Abstract要約: Generative Semantic Communication (GSC) は狭帯域および高雑音チャネル上の画像伝送のための有望なソリューションである。
既存のGSC法は、ガウスから意味論的に導かれる画像分布への長い間接輸送軌道に依存している。
本稿では,ガウス制限を破り,意味論から画像への直接的生成復号を可能にするSchrdinger BridgeベースのGSCを提案する。
- 参考スコア(独自算出の注目度): 59.85230215774303
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative Semantic Communication (GSC) is a promising solution for image transmission over narrow-band and high-noise channels. However, existing GSC methods rely on long, indirect transport trajectories from a Gaussian to an image distribution guided by semantics, causing severe hallucination and high computational cost. To address this, we propose a general framework named Schrödinger Bridge-based GSC (SBGSC). By leveraging the Schrödinger Bridge (SB) to construct optimal transport trajectories between arbitrary distributions, SBGSC breaks Gaussian limitations and enables direct generative decoding from semantics to images. Within this framework, we design Diffusion SB-based GSC (DSBGSC). DSBGSC reconstructs the nonlinear drift term of diffusion models using Schrödinger potentials, achieving direct optimal distribution transport to reduce hallucinations and computational overhead. To further accelerate generation, we propose a self-consistency-based objective guiding the model to learn a nonlinear velocity field pointing directly toward the image, bypassing Markovian noise prediction to significantly reduce sampling steps. Simulation results demonstrate that DSBGSC outperforms state-of-the-art GSC methods, improving FID by at least 38% and SSIM by 49.3%, while accelerating inference speed by over 8 times.
- Abstract(参考訳): Generative Semantic Communication (GSC) は狭帯域および高雑音チャネル上の画像伝送のための有望なソリューションである。
しかし、既存のGSC法は、ガウス語から意味論的に導かれる画像分布への長い間接的な輸送軌跡に依存しており、幻覚と計算コストが高い。
そこで我々はSchrödinger Bridge-based GSC (SBGSC) というフレームワークを提案する。
シュレーディンガー橋(SB)を利用して任意の分布間の最適な輸送軌跡を構築することにより、SBGSCはガウスの制限を破り、意味論から画像への直接生成復号を可能にする。
本フレームワークでは,Diffusion SB-based GSC (DSBGSC) を設計する。
DSBGSCはシュレーディンガーポテンシャルを用いて拡散モデルの非線形ドリフト項を再構成し、幻覚と計算オーバーヘッドを減らすために直接最適分布輸送を達成する。
さらに生成を高速化するために,マルコフ雑音予測を回避し,サンプリングステップを大幅に削減し,画像に直接向ける非線形速度場を学習するための自己整合性に基づく客観的モデルを提案する。
シミュレーションの結果、DSBGSCは最先端のGSC法より優れ、FIDは少なくとも38%、SSIMは49.3%向上し、推論速度は8倍以上向上した。
関連論文リスト
- Channel Knowledge Map Construction via Guided Flow Matching [22.16429053407676]
線形輸送誘導フローマッチング(LT-GFM)に基づく新しいフレームワークを提案する。
本稿では,従来のチャネルゲインマップ(CGM)構築だけでなく,より困難な相関マップ(SCM)構築にも適用可能な統一アーキテクチャを提案する。
シミュレーションの結果, LT-GFMはFréchet Inception Distance (FID) よりも有意に低い分布忠実度を実現し, DDPMに比べて25倍の速度で推論速度を加速することがわかった。
論文 参考訳(メタデータ) (2026-01-06T08:25:56Z) - Walking the Schrödinger Bridge: A Direct Trajectory for Text-to-3D Generation [51.337622918786074]
本稿では,新しいテキストから3D生成フレームワークであるTray-Centric Distillation (TraCe)を紹介する。
TraCeは、最先端技術よりも優れた品質と忠実性を実現している。
論文 参考訳(メタデータ) (2025-11-06T09:21:57Z) - Green Learning for STAR-RIS mmWave Systems with Implicit CSI [53.03358325565645]
再構成可能なインテリジェントサーフェス (STAR-RIS) 支援ミリ波放送システム (mmWave) を同時に送信し, 反射するグリーンラーニング (GL) ベースのプリコーディングフレームワークを提案する。
本研究は,将来の6Gネットワークにおける環境持続可能性を重視し,複数のユーザが同一情報を共有し,スペクトル効率を向上し,冗長伝送と電力消費を低減させるシナリオに,トランスミッションフレームワークを採用する。
論文 参考訳(メタデータ) (2025-09-08T15:56:06Z) - ReDiSC: A Reparameterized Masked Diffusion Model for Scalable Node Classification with Structured Predictions [64.17845687013434]
本稿では,構造化ノード分類のための構造拡散モデルであるReDiSCを提案する。
本稿では,ReDiSCが最先端のGNN,ラベル伝搬,拡散ベースラインと比較して,優れた,あるいは高い競争力を発揮することを示す。
特にReDiSCは、従来の構造化拡散法が計算制約によって失敗する大規模データセットに効果的にスケールする。
論文 参考訳(メタデータ) (2025-07-19T04:46:53Z) - DPBridge: Latent Diffusion Bridge for Dense Prediction [49.1574468325115]
DPBridgeは、密度予測タスクのための最初の潜伏拡散ブリッジフレームワークである。
提案手法は,異なるシナリオ下での有効性と能力の一般化を実証し,優れた性能を継続的に達成する。
論文 参考訳(メタデータ) (2024-12-29T15:50:34Z) - SL-CycleGAN: Blind Motion Deblurring in Cycles using Sparse Learning [3.6828576285640353]
本稿では,単一画像視覚障害者のためのスパース学習に基づくGAN(End-to-end Generative Adversarial Network)を提案する。
視覚障害者にとって初めて、スパース畳み込み層とトレーニング可能な空間プーラk-ウィンナーの組み合わせとしてスパースResNetブロックを提案する。
我々は、GoProデータセット上で38.087dBのPSNRを記録破りに達成し、最新のデブロアリング法よりも5.377dBのPSNRを実現した。
論文 参考訳(メタデータ) (2021-11-07T07:42:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。