論文の概要: Switchcodec: Adaptive residual-expert sparse quantization for high-fidelity neural audio coding
- arxiv url: http://arxiv.org/abs/2601.20362v1
- Date: Wed, 28 Jan 2026 08:26:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-29 15:46:06.839049
- Title: Switchcodec: Adaptive residual-expert sparse quantization for high-fidelity neural audio coding
- Title(参考訳): スイッチコーデック:高忠実性ニューラルオーディオ符号化のための適応残差スパース量子化
- Authors: Xiangbo Wang, Wenbin Jiang, Jin Wang, Yubo You, Sheng Fang, Fei Wen,
- Abstract要約: SwitchCodecはResidual Experts Vector Quantization(REVQ)に基づくニューラルオーディオである。
REVQは、共有量子化器と動的にルーティングされた専門家量子化器を結合し、入力オーディオに従って活性化される。
SwitchCodecは、客観的メトリクスと主観的リスニングテストの両方の既存のベースラインを超えている。
- 参考スコア(独自算出の注目度): 11.19956590509655
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent neural audio compression models often rely on residual vector quantization for high-fidelity coding, but using a fixed number of per-frame codebooks is suboptimal for the wide variability of audio content-especially for signals that are either very simple or highly complex. To address this limitation, we propose SwitchCodec, a neural audio codec based on Residual Experts Vector Quantization (REVQ). REVQ combines a shared quantizer with dynamically routed expert quantizers that are activated according to the input audio, decoupling bitrate from codebook capacity and improving compression efficiency. This design ensures full training and utilization of each quantizer. In addition, a variable-bitrate mechanism adjusts the number of active expert quantizers at inference, enabling multi-bitrate operation without retraining. Experiments demonstrate that SwitchCodec surpasses existing baselines on both objective metrics and subjective listening tests.
- Abstract(参考訳): 近年のニューラルオーディオ圧縮モデルは、高忠実度符号化のために残留ベクトル量子化に依存することが多いが、固定数のフレーム単位のコードブックを使用すると、オーディオコンテンツの広範囲な可変性、特に非常に単純または非常に複雑である信号に最適である。
この制限に対処するため,Residual Experts Vector Quantization (REVQ)に基づくニューラルオーディオコーデックであるSwitchCodecを提案する。
REVQは共有量子化器と動的にルーティングされた専門家量子化器を結合し、入力オーディオに従って活性化され、ビットレートをコードブックの容量から分離し、圧縮効率を向上させる。
この設計により、各量子化器の完全なトレーニングと利用が保証される。
さらに、可変ビットレート機構は、推論時にアクティブな専門家量子化器の数を調整し、再トレーニングせずにマルチビットレート操作を可能にする。
実験によると、SwitchCodecは客観的メトリクスと主観的リスニングテストの両方で既存のベースラインを超えている。
関連論文リスト
- L3AC: Towards a Lightweight and Lossless Audio Codec [10.903708510237875]
我々は、単一量子化器と高効率アーキテクチャを活用することで課題に対処する軽量なニューラルオーディオであるL3ACを紹介する。
L3ACは、複数の時間スケールにわたる音響変化を捉えるように設計された新しい構造であるTConvとともに、合理化された畳み込みネットワークとローカルトランスフォーマーモジュールを探索する。
論文 参考訳(メタデータ) (2025-04-07T11:34:39Z) - Efficient Evaluation of Quantization-Effects in Neural Codecs [4.897318643396687]
ニューラルコーデックのトレーニングには、量子化器の非ゼロ勾配を許容する技術が必要である。
本稿では,シミュレーションデータを用いたニューラルコーデックの効率的な評価手法を提案する。
内科的音声勾配と最先端のdescript-audio-codecに対する検討を行った。
論文 参考訳(メタデータ) (2025-02-07T09:11:19Z) - QSpec: Speculative Decoding with Complementary Quantization Schemes [53.960146187821685]
大規模言語モデル(LLM)における推論の高速化とメモリ消費削減のために量子化が広く採用されている
品質から効率を分離する新しい量子化パラダイムであるQSpecを提案する。
QSpecは重みとKVキャッシュの両方を段階的に再利用し、再トレーニングや補助モデルなしでほぼゼロコストで切り替えることができる。
論文 参考訳(メタデータ) (2024-10-15T05:57:51Z) - Variable Bitrate Residual Vector Quantization for Audio Coding [29.368893236587343]
最近のニューラルオーディオ圧縮モデルでは、残留ベクトル量子化(RVQ)が徐々に採用されている
これらのモデルはフレーム毎に一定数のコードブックを使用し、レート・歪曲トレードオフの点では最適である。
本稿では,音声コーデックの可変RVQ (VRVQ) を提案する。
論文 参考訳(メタデータ) (2024-10-08T13:18:24Z) - The END: An Equivariant Neural Decoder for Quantum Error Correction [73.4384623973809]
データ効率のよいニューラルデコーダを導入し、この問題の対称性を活用する。
本稿では,従来のニューラルデコーダに比べて精度の高い新しい同変アーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-04-14T19:46:39Z) - Deep Quantum Error Correction [73.54643419792453]
量子誤り訂正符号(QECC)は、量子コンピューティングのポテンシャルを実現するための鍵となる要素である。
本研究では,新しいエンペンド・ツー・エンドの量子誤りデコーダを効率的に訓練する。
提案手法は,最先端の精度を実現することにより,QECCのニューラルデコーダのパワーを実証する。
論文 参考訳(メタデータ) (2023-01-27T08:16:26Z) - Improved decoding of circuit noise and fragile boundaries of tailored
surface codes [61.411482146110984]
高速かつ高精度なデコーダを導入し、幅広い種類の量子誤り訂正符号で使用することができる。
我々のデコーダは、信仰マッチングと信念フィンドと呼ばれ、すべてのノイズ情報を活用し、QECの高精度なデモを解き放つ。
このデコーダは, 標準の正方形曲面符号に対して, 整形曲面符号において, より高いしきい値と低い量子ビットオーバーヘッドをもたらすことがわかった。
論文 参考訳(メタデータ) (2022-03-09T18:48:54Z) - Variational Autoencoders: A Harmonic Perspective [79.49579654743341]
本研究では,高調波解析の観点から変分オートエンコーダ(VAE)について検討する。
VAEのエンコーダ分散は、VAEエンコーダとデコーダニューラルネットワークによってパラメータ化された関数の周波数内容を制御する。
論文 参考訳(メタデータ) (2021-05-31T10:39:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。