論文の概要: MOC-RVQ: Multilevel Codebook-assisted Digital Generative Semantic
Communication
- arxiv url: http://arxiv.org/abs/2401.01272v1
- Date: Tue, 2 Jan 2024 16:17:43 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-03 13:23:40.151539
- Title: MOC-RVQ: Multilevel Codebook-assisted Digital Generative Semantic
Communication
- Title(参考訳): MOC-RVQ:多レベルコードブック支援ディジタル生成セマンティックコミュニケーション
- Authors: Yingbin Zhou, Yaping Sun, Guanying Chen, Xiaodong Xu, Hao Chen,
Binhong Huang, Shuguang Cui, Ping Zhang
- Abstract要約: 本稿では,2段階の学習フレームワークを用いた多段階生成セマンティックコミュニケーションシステムを提案する。
最初の段階では、マルチヘッドオクタナリーコードブック(MOC)を用いて高品質なコードブックをトレーニングし、インデックス範囲を圧縮する。
第2段階では、Swin Transformerに基づくノイズ低減ブロック(NRB)とマルチレベルコードブックを導入する。
- 参考スコア(独自算出の注目度): 45.038606603738586
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Vector quantization-based image semantic communication systems have
successfully boosted transmission efficiency, but face a challenge with
conflicting requirements between codebook design and digital constellation
modulation. Traditional codebooks need a wide index range, while modulation
favors few discrete states. To address this, we propose a multilevel generative
semantic communication system with a two-stage training framework. In the first
stage, we train a high-quality codebook, using a multi-head octonary codebook
(MOC) to compress the index range. We also integrate a residual vector
quantization (RVQ) mechanism for effective multilevel communication. In the
second stage, a noise reduction block (NRB) based on Swin Transformer is
introduced, coupled with the multilevel codebook from the first stage, serving
as a high-quality semantic knowledge base (SKB) for generative feature
restoration. Experimental results highlight MOC-RVQ's superior performance over
methods like BPG or JPEG, even without channel error correction coding.
- Abstract(参考訳): ベクトル量子化に基づく画像意味コミュニケーションシステムは伝送効率の向上に成功しているが、コードブック設計とデジタルコンステレーション変調の相反する要件に直面している。
伝統的なコードブックは幅広いインデックス範囲を必要とするが、変調は少ない離散状態を好む。
そこで本研究では,二段階学習フレームワークを用いた多レベル生成意味コミュニケーションシステムを提案する。
第1段階では,マルチヘッドオクタナリーコードブック(moc)を用いて,ハイクオリティなコードブックをトレーニングし,インデックス範囲を圧縮する。
また,マルチレベル通信のための残差ベクトル量子化(rvq)機構も統合した。
第2段階では、Swin Transformerに基づくノイズ低減ブロック(NRB)と、第1段からのマルチレベルコードブックが組み合わされ、生成的特徴回復のための高品質なセマンティックナレッジベース(SKB)として機能する。
実験結果は,チャネル誤り訂正符号がなくても,BPGやJPEGなどの手法よりもMOC-RVQの方が優れた性能を示す。
関連論文リスト
- Analog information decoding of bosonic quantum LDPC codes [3.583379205722195]
本稿では,ボソニック量子ビット読み出しから得られたシンドローム情報を明示的に活用する新しい復号法を提案する。
その結果,アナログ情報を用いた一般的な復号アルゴリズムの基礎となり,フォールトトレラント量子計算の方向に有望な結果を示すことができた。
論文 参考訳(メタデータ) (2023-11-02T15:41:03Z) - Towards Accurate Image Coding: Improved Autoregressive Image Generation
with Dynamic Vector Quantization [73.52943587514386]
既存のベクトル量子化(VQ)ベースの自己回帰モデルは、2段階生成パラダイムに従う。
画像領域を可変長符号に符号化する動的量子化VAE(DQ-VAE)を提案する。
論文 参考訳(メタデータ) (2023-05-19T14:56:05Z) - A Multi-Stage Multi-Codebook VQ-VAE Approach to High-Performance Neural
TTS [52.51848317549301]
高速なTTS合成のためのマルチステージマルチコードブック(MSMC)手法を提案する。
ベクトル量子化可変オートエンコーダ(VQ-VAE)に基づく特徴解析器を用いて,音声訓練データのメルスペクトルを符号化する。
合成において、ニューラルネットワークは予測されたSMCRを最終的な音声波形に変換する。
論文 参考訳(メタデータ) (2022-09-22T09:43:17Z) - Learning Representations for CSI Adaptive Quantization and Feedback [51.14360605938647]
本稿では,周波数分割二重化システムにおける適応量子化とフィードバックの効率的な手法を提案する。
既存の研究は主に、CSI圧縮のためのオートエンコーダ(AE)ニューラルネットワークの実装に焦点を当てている。
1つはポストトレーニング量子化に基づくもので、もう1つはAEのトレーニング中にコードブックが見つかる方法である。
論文 参考訳(メタデータ) (2022-07-13T08:52:13Z) - Tensor Learning-based Precoder Codebooks for FD-MIMO Systems [47.562560779723334]
本稿では,FD(Full-dimension)マルチインプット・マルチアウトプット(MIMO)システムにおいて,プリコーディングのための低複雑さなコードブックを設計するための効率的な手法を開発する。
モデルフリーなデータ駆動型アプローチを機械学習の基礎として利用し、周辺伝播条件に適応するコードブックを生成する。
論文 参考訳(メタデータ) (2021-06-21T19:18:39Z) - Quantum repeaters based on concatenated bosonic and discrete-variable
quantum codes [7.022007590511487]
伝送量子ビットを2つのレベルからなるボゾンド符号に符号化することを提案する。
最初のレベルでは、1つのボソニックモードでキュービットを符号化する連続可変GKPコードを使用します。
2番目のレベルでは、小さな離散変数のコードを使用します。
論文 参考訳(メタデータ) (2020-11-30T18:14:39Z) - Learning on a Grassmann Manifold: CSI Quantization for Massive MIMO
Systems [37.499485219254545]
本稿では,基礎となるチャネル分布に対する平均正規化ビームフォーミングゲインを最大化するビームフォーミングコードブックの設計に焦点をあてる。
我々は,機械学習の基礎となるモデルフリーなデータ駆動型手法を用いて,周囲の伝搬条件に適応するビームフォーミングコードブックを生成する。
論文 参考訳(メタデータ) (2020-05-18T01:01:36Z) - Optimal Gradient Quantization Condition for Communication-Efficient
Distributed Training [99.42912552638168]
勾配の通信は、コンピュータビジョンアプリケーションで複数のデバイスでディープニューラルネットワークをトレーニングするのに費用がかかる。
本研究は,textbfANY勾配分布に対する二値および多値勾配量子化の最適条件を導出する。
最適条件に基づいて, 偏差BinGradと非偏差ORQの2値勾配量子化と多値勾配量子化の2つの新しい量子化手法を開発した。
論文 参考訳(メタデータ) (2020-02-25T18:28:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。