論文の概要: Wireless Video Semantic Communication with Decoupled Diffusion Multi-frame Compensation
- arxiv url: http://arxiv.org/abs/2511.02478v1
- Date: Tue, 04 Nov 2025 11:05:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 18:47:05.964172
- Title: Wireless Video Semantic Communication with Decoupled Diffusion Multi-frame Compensation
- Title(参考訳): 分離拡散多フレーム補償による無線映像セマンティック通信
- Authors: Bingyan Xie, Yongpeng Wu, Yuxuan Shi, Biqian Feng, Wenjun Zhang, Jihong Park, Tony Quek,
- Abstract要約: 分散多重フレーム補償を分離した無線ビデオセマンティック通信フレームワークを提案する。
WVSC-Dはまず、オリジナルのビデオフレームをセマンティックフレームとしてエンコードし、その後、そのようなコンパクトな表現に基づいてビデオコーディングを行う。
さらに通信オーバヘッドを低減するため、共通ビデオ符号化方式において、各フレームの動作ベクトルを代用する参照セマンティックフレームを導入する。
- 参考スコア(独自算出の注目度): 21.650559510264312
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing wireless video transmission schemes directly conduct video coding in pixel level, while neglecting the inner semantics contained in videos. In this paper, we propose a wireless video semantic communication framework with decoupled diffusion multi-frame compensation (DDMFC), abbreviated as WVSC-D, which integrates the idea of semantic communication into wireless video transmission scenarios. WVSC-D first encodes original video frames as semantic frames and then conducts video coding based on such compact representations, enabling the video coding in semantic level rather than pixel level. Moreover, to further reduce the communication overhead, a reference semantic frame is introduced to substitute motion vectors of each frame in common video coding methods. At the receiver, DDMFC is proposed to generate compensated current semantic frame by a two-stage conditional diffusion process. With both the reference frame transmission and DDMFC frame compensation, the bandwidth efficiency improves with satisfying video transmission performance. Experimental results verify the performance gain of WVSC-D over other DL-based methods e.g. DVSC about 1.8 dB in terms of PSNR.
- Abstract(参考訳): 既存の無線ビデオ伝送方式は、ビデオに含まれる内部意味を無視しながら、ピクセルレベルで直接ビデオ符号化を行う。
本稿では,WVSC-Dと略される分散多重フレーム補償(DDMFC)を備えた無線ビデオセマンティック通信フレームワークを提案する。
WVSC-Dはまず、オリジナルのビデオフレームをセマンティックフレームとしてエンコードし、その後、そのようなコンパクトな表現に基づいてビデオコーディングを行う。
さらに、通信オーバーヘッドをさらに軽減するために、共通ビデオ符号化方式で各フレームの運動ベクトルを代用する参照セマンティックフレームを導入する。
受信機において、DDMFCは2段階の条件拡散プロセスにより補償電流意味フレームを生成する。
基準フレーム伝送とDDMFCフレーム補償の両方により、帯域幅効率はビデオ伝送性能を満足して向上する。
実験結果から,PSNRで約1.8dBのDVSCを含む他のDLベース手法と比較して,WVSC-Dの性能向上が検証された。
関連論文リスト
- Context Video Semantic Transmission with Variable Length and Rate Coding over MIMO Channels [49.624608869195065]
無線ビデオ伝送のためのコンテキストビデオセマンティックトランスミッション(CVST)フレームワークを提案する。
我々は、特徴群と多重入力多重出力(MIMO)サブチャネルの関係を明確に定式化するために、コンテキストチャネル相関マップを学習する。
近年の無線ビデオ・セマンティック・コミュニケーション・アプローチにおいて,標準化された分離符号化方式に対して性能が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2025-12-23T10:48:43Z) - VLF-MSC: Vision-Language Feature-Based Multimodal Semantic Communication System [0.9176056742068811]
Vision-Language Feature-based Multimodal Semantic Communication (VLF-MSC) は、単一の視覚言語表現を送信し、受信機での画像生成とテキスト生成をサポートする統一システムである。
基礎モデルを活用することにより,意味的忠実性を維持しつつ,チャネルノイズに対する堅牢性を実現する。
論文 参考訳(メタデータ) (2025-11-13T08:29:32Z) - Motion-Aware Concept Alignment for Consistent Video Editing [57.08108545219043]
MoCA-Video (Motion-Aware Concept Alignment in Video) は、画像ドメインのセマンティックミキシングとビデオのギャップを埋めるトレーニング不要のフレームワークである。
生成されたビデオとユーザが提供した参照画像が与えられた後、MoCA-Videoは参照画像のセマンティックな特徴をビデオ内の特定のオブジェクトに注入する。
我々は、標準SSIM、画像レベルLPIPS、時間LPIPSを用いてMoCAの性能を評価し、新しいメトリクスCASS(Conceptual Alignment Shift Score)を導入し、ソースプロンプトと修正ビデオフレーム間の視覚的シフトの一貫性と有効性を評価する。
論文 参考訳(メタデータ) (2025-06-01T13:28:04Z) - WVSC: Wireless Video Semantic Communication with Multi-frame Compensation [56.63352157833874]
既存の無線ビデオ伝送方式は画素レベルで直接映像符号化を行う。
本稿では,WVSCと略される無線ビデオセマンティック通信フレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-27T06:27:15Z) - Generative Video Semantic Communication via Multimodal Semantic Fusion with Large Model [52.420489186647295]
本稿では,高品質な映像再構成を実現するために,意味情報を抽出し,送信するスケーラブルなビデオ意味コミュニケーションフレームワークを提案する。
具体的には、送信機では、それぞれテキストと構造的意味論として機能するソースビデオから記述と他の条件信号を抽出する。
受信機では、拡散に基づくGenAI大モデルを用いて、ビデオの再構成のために複数のモーダルのセマンティクスを融合させる。
論文 参考訳(メタデータ) (2025-02-19T15:59:07Z) - Semantic-Aware Adaptive Video Streaming Using Latent Diffusion Models for Wireless Networks [12.180483357502293]
本稿では,遅延拡散モデル(LDM)をFF手法に組み込んだリアルタイム適応ビットレートビデオストリーミングのための新しいフレームワークを提案する。
提案手法はLDMを利用してIフレームを潜在空間に圧縮し,ストレージとセマンティックトランスミッションの大幅な節約を実現する。
この作業は、5Gおよび将来の5Gネットワークにおけるスケーラブルなリアルタイムビデオストリーミングの新たな可能性を開く。
論文 参考訳(メタデータ) (2025-02-08T21:14:28Z) - When Video Coding Meets Multimodal Large Language Models: A Unified Paradigm for Video Coding [118.72266141321647]
CMVC(Cross-Modality Video Coding)は、ビデオ符号化における多モード表現とビデオ生成モデルを探索する先駆的な手法である。
復号化の際には、以前に符号化されたコンポーネントとビデオ生成モデルを利用して複数の復号モードを生成する。
TT2Vは効果的な意味再構成を実現し,IT2Vは競争力のある知覚整合性を示した。
論文 参考訳(メタデータ) (2024-08-15T11:36:18Z) - Synchronous Multi-modal Semantic Communication System with Packet-level Coding [20.397350999784276]
パケットレベル符号化を用いた同期型マルチモーダルセマンティック通信システム(SyncSC)を提案する。
意味的・時間的同期を実現するため、3Dモーフィブルモード(3DMM)係数とテキストを意味論として送信する。
消去チャネル下でのセマンティックパケットの保護を目的として,パケット損失率が高い場合でも一定の視覚的品質を維持できるパケットレベルフォワード誤り訂正法(PacSC)を提案する。
論文 参考訳(メタデータ) (2024-08-08T15:42:00Z) - Neighbor Correspondence Matching for Flow-based Video Frame Synthesis [90.14161060260012]
フローベースフレーム合成のための近傍対応マッチング(NCM)アルゴリズムを提案する。
NCMは現在のフレームに依存しない方法で実行され、各ピクセルの時空間近傍でマルチスケールの対応を確立する。
粗いスケールのモジュールは、近隣の対応を利用して大きな動きを捉えるように設計されている。
論文 参考訳(メタデータ) (2022-07-14T09:17:00Z) - Wireless Deep Video Semantic Transmission [14.071114007641313]
本稿では,無線チャネル上でのエンドツーエンドビデオ伝送を実現するための,高効率なディープ・ジョイント・ソース・チャネル符号化手法を提案する。
我々のフレームワークはディープビデオセマンティックトランスミッション (DVST) という名前で収集される。
論文 参考訳(メタデータ) (2022-05-26T03:26:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。