論文の概要: PrismQuant: Rate-Distortion-Optimal Vector Quantization for Gaussian-Mixture Sources
- arxiv url: http://arxiv.org/abs/2605.15507v1
- Date: Fri, 15 May 2026 01:05:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-18 21:22:26.13746
- Title: PrismQuant: Rate-Distortion-Optimal Vector Quantization for Gaussian-Mixture Sources
- Title(参考訳): PrismQuant:Gaussian-Mixtureソースに対するレート歪み最適ベクトル量子化
- Authors: Bumsu Park, Chanho Park, Youngmok Park, Namyoon Lee,
- Abstract要約: コンポーネントラベルを損失なく送信し、コンポーネントマッチングKLTを用いて残余を符号化するPrismQuantを導入する。
実世界のチャネル状態情報(CSI)データに対する実験は、トランスフォーマーベースの学習コーデックと比較して、競争力または優れた性能を示す。
- 参考スコア(独自算出の注目度): 32.267305083092594
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: For a Gaussian source under mean-squared error (MSE), classical transform coding is rate--distortion (RD) optimal: the Karhunen--Loeve transform (KLT) diagonalizes the covariance, reverse waterfilling allocates the bits, and scalar quantization closes the loop. This elegant story breaks down for multimodal sources, where no single covariance can capture heterogeneous local geometries, and the RD function loses its closed form. We revisit this problem through Gaussian-mixture sources and develop a constructive RD theory for them. Our key finding is that the mixture structure incurs only a component label cost. Conditioned on the active mixture component, each branch is Gaussian; the challenge is allocating bits across heterogeneous branches. We prove that the genie-aided conditional RD function is governed by a single global reverse-waterfilling level shared across all components and eigenmodes. Building on this result, we introduce PrismQuant, which transmits the component label losslessly and encodes the residual using the component-matched KLT, followed by scalar quantization, achieving a rate of H(C)/n bits per source dimension of the converse, with a vanishing asymptotic gap. We further develop a practical implementation based on EM-driven Gaussian-mixture learning, component-adaptive KLTs, and entropy-constrained scalar quantization (ECSQ). Experiments on synthetic Gaussian mixtures show that PrismQuant closely approaches the theoretical RD bound, while experiments on real-world channel-state-information (CSI) data demonstrate competitive or superior performance compared with transformer-based learned codecs at more than one order of magnitude smaller model size.
- Abstract(参考訳): 平均二乗誤差 (MSE) の下でガウス音源に対して、古典的な変換符号化はレート歪み (RD) が最適である: カルフン-ローブ変換 (KLT) は共分散を対角化し、逆水充填はビットを割り当て、スカラー量子化はループを閉じる。
このエレガントなストーリーは、単一の共分散が不均一な局所幾何学を捉えることができず、RD関数はその閉形式を失うマルチモーダルソースに対して分解される。
我々はガウス混合源を通してこの問題を再検討し、それらに対する構築的RD理論を開発する。
私たちの重要な発見は、混合構造がコンポーネントラベルのコストだけを発生させることです。
活性混合成分を条件に、各枝はガウス的であり、不均一な枝にビットを割り当てることが課題である。
我々は、ジェニー支援条件付きRD関数が、すべての成分と固有モデムで共有される単一の大域的逆給水レベルによって支配されていることを証明した。
この結果に基づいて、コンポーネントラベルを損失なく送信し、コンポーネントマッチングKLTを用いて残余を符号化するPrismQuantを導入し、続いてスカラー量子化を行い、コンバースのソース次元あたりのH(C)/nビットの割合を、漸近的ギャップを無くして達成する。
さらに,EM駆動型ガウス混合学習,コンポーネント適応型KLT,エントロピー制約付きスカラー量子化(ECSQ)に基づく実用的な実装を開発した。
合成ガウス混合の実験では、PrismQuantは理論RD境界に近づき、実際のチャネル状態情報(CSI)データに対する実験は、トランスフォーマーベースの学習コーデックに比べて、1桁以上のモデルサイズでの競争力または優れた性能を示した。
関連論文リスト
- Parallel Complex Diffusion for Scalable Time Series Generation [50.01609741902786]
PaCoDiは周波数領域における生成モデリングを分離するスペクトルネイティブアーキテクチャである。
本研究では,PaCoDiが生成品質と推論速度の両方において,既存のベースラインを上回っていることを示す。
論文 参考訳(メタデータ) (2026-02-10T14:31:53Z) - WUSH: Near-Optimal Adaptive Transforms for LLM Quantization [52.77441224845925]
低ビット幅への量子化は、大きな言語モデルをデプロイするための標準的なアプローチである。
いくつかの極端な重みと活性化は、ダイナミックレンジを拡張し、量子化器の有効分解能を減少させる。
結合重みアクティベーション量子化のための閉形式最適線形ブロックワイズ変換を初めて導出する。
論文 参考訳(メタデータ) (2025-11-30T16:17:34Z) - GMR-Conv: An Efficient Rotation and Reflection Equivariant Convolution Kernel Using Gaussian Mixture Rings [4.365790707793824]
ガウス重み付き環の混合を用いて放射対称性を滑らかにする効率的な畳み込み核を導入する。
8つの分類と1つのセグメンテーションデータセットの実験は、GMR-Convが従来のCNNのパフォーマンスにマッチするだけでなく、向きのないデータを持つアプリケーションでもそれを上回ることを示した。
論文 参考訳(メタデータ) (2025-04-03T17:58:18Z) - On the Computation of the Gaussian Rate-Distortion-Perception Function [10.564071872770146]
平均二乗誤差(MSE)歪み下における多変量ガウス音源に対するレート歪み知覚関数(RDPF)の計算について検討した。
我々は、関連するアルゴリズムの実現、および収束と収束のキャラクタリゼーションの速度を提供する。
計算結果を数値シミュレーションで相関させ,既存の結果に関連付ける。
論文 参考訳(メタデータ) (2023-11-15T18:34:03Z) - Solving High Frequency and Multi-Scale PDEs with Gaussian Processes [18.190228010565367]
PINNは、しばしば高周波およびマルチスケールのPDEを解決するのに苦労する。
我々はこの問題を解決するためにガウス過程(GP)フレームワークを利用する。
我々はKroneckerの製品特性と多線型代数を用いて計算効率とスケーラビリティを向上する。
論文 参考訳(メタデータ) (2023-11-08T05:26:58Z) - Gaussian Mixture Solvers for Diffusion Models [84.83349474361204]
本稿では,拡散モデルのためのGMSと呼ばれる,SDEに基づく新しい解法について紹介する。
画像生成およびストロークベース合成におけるサンプル品質の観点から,SDEに基づく多くの解法よりも優れる。
論文 参考訳(メタデータ) (2023-11-02T02:05:38Z) - Importance sampling for stochastic quantum simulations [68.8204255655161]
我々は、係数に応じてハミルトン式からサンプリングしてランダムな積公式を構築するqDriftプロトコルを導入する。
サンプリング段階における個別のシミュレーションコストを考慮し、同じ精度でシミュレーションコストを削減可能であることを示す。
格子核効果場理論を用いて数値シミュレーションを行った結果, 実験結果が得られた。
論文 参考訳(メタデータ) (2022-12-12T15:06:32Z) - Gaussian Mixture Convolution Networks [13.493166990188278]
本稿では,多次元ガウス混合の解析的畳み込みに基づく新しい深層学習法を提案する。
このアーキテクチャに基づくネットワークは,MNIST と ModelNet のデータセットに適合したガウス混合の競合精度に達することを示す。
論文 参考訳(メタデータ) (2022-02-18T12:07:52Z) - Plug-And-Play Learned Gaussian-mixture Approximate Message Passing [71.74028918819046]
そこで本研究では,従来のi.i.d.ソースに適した圧縮圧縮センシング(CS)リカバリアルゴリズムを提案する。
我々のアルゴリズムは、Borgerdingの学習AMP(LAMP)に基づいて構築されるが、アルゴリズムに普遍的な復調関数を採用することにより、それを大幅に改善する。
数値評価により,L-GM-AMPアルゴリズムは事前の知識を必要とせず,最先端の性能を実現する。
論文 参考訳(メタデータ) (2020-11-18T16:40:45Z) - Gaussianization Flows [113.79542218282282]
そこで本研究では,サンプル生成における効率のよい繰り返しと効率のよい逆変換を両立できる新しい型正規化フローモデルを提案する。
この保証された表現性のため、サンプル生成の効率を損なうことなく、マルチモーダルなターゲット分布をキャプチャできる。
論文 参考訳(メタデータ) (2020-03-04T08:15:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。