論文の概要: Efficient Evaluation of Quantization-Effects in Neural Codecs
- arxiv url: http://arxiv.org/abs/2502.04770v1
- Date: Fri, 07 Feb 2025 09:11:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-10 14:55:30.533774
- Title: Efficient Evaluation of Quantization-Effects in Neural Codecs
- Title(参考訳): ニューラルコーデックにおける量子化効果の効率的評価
- Authors: Wolfgang Mack, Ahmed Mustafa, Rafał Łaganowski, Samer Hijazy,
- Abstract要約: ニューラルコーデックのトレーニングには、量子化器の非ゼロ勾配を許容する技術が必要である。
本稿では,シミュレーションデータを用いたニューラルコーデックの効率的な評価手法を提案する。
内科的音声勾配と最先端のdescript-audio-codecに対する検討を行った。
- 参考スコア(独自算出の注目度): 4.897318643396687
- License:
- Abstract: Neural codecs, comprising an encoder, quantizer, and decoder, enable signal transmission at exceptionally low bitrates. Training these systems requires techniques like the straight-through estimator, soft-to-hard annealing, or statistical quantizer emulation to allow a non-zero gradient across the quantizer. Evaluating the effect of quantization in neural codecs, like the influence of gradient passing techniques on the whole system, is often costly and time-consuming due to training demands and the lack of affordable and reliable metrics. This paper proposes an efficient evaluation framework for neural codecs using simulated data with a defined number of bits and low-complexity neural encoders/decoders to emulate the non-linear behavior in larger networks. Our system is highly efficient in terms of training time and computational and hardware requirements, allowing us to uncover distinct behaviors in neural codecs. We propose a modification to stabilize training with the straight-through estimator based on our findings. We validate our findings against an internal neural audio codec and against the state-of-the-art descript-audio-codec.
- Abstract(参考訳): エンコーダ、量子化器、デコーダからなるニューラルコーデックは、非常に低いビットレートでの信号伝送を可能にする。
これらのシステムのトレーニングには、ストレートスルー推定器、ソフト・ツー・ハードアニール、統計量化器エミュレーションのような技術が必要である。
神経コーデックにおける量子化の効果を評価する、例えば勾配通過技術がシステム全体に与える影響は、トレーニング要求と安価な信頼性のあるメトリクスの欠如により、しばしばコストと時間を要する。
本稿では,大規模ネットワークにおける非線形動作をエミュレートするために,定義ビット数と低複素性ニューラルエンコーダ/デコーダを用いたシミュレーションデータを用いたニューラルネットワークの効率的な評価フレームワークを提案する。
我々のシステムは、トレーニング時間と計算およびハードウェア要件の点で非常に効率的であり、ニューラルコーデックにおける異なる振る舞いを明らかにすることができる。
本研究は, ストレートスルー推定器によるトレーニングの安定化を図ったものである。
内部のニューラルオーディオコーデックと最先端のdescript-audio-codecに対して検討した。
関連論文リスト
- Neuromorphic Auditory Perception by Neural Spiketrum [27.871072042280712]
本研究では、時間変化のアナログ信号を効率的なスパイクパターンに変換するために、スパイク時相と呼ばれるニューラルスパイク符号化モデルを導入する。
このモデルは、様々な聴覚知覚タスクにおいて、スパイクニューラルネットワークのトレーニングを容易にする、正確に制御可能なスパイクレートを備えたスパースで効率的な符号化スキームを提供する。
論文 参考訳(メタデータ) (2023-09-11T13:06:19Z) - A Cryogenic Memristive Neural Decoder for Fault-tolerant Quantum Error Correction [0.0]
インメモリ・クロスバー(IMC)アーキテクチャに基づくニューラルデコーダの設計と解析を行う。
ハードウェアを意識したリトレーニング手法を開発し、フィデリティ損失を軽減する。
この研究は、フォールトトレラントQECの統合のためのスケーラブルで高速で低消費電力のMCCハードウェアへの経路を提供する。
論文 参考訳(メタデータ) (2023-07-18T17:46:33Z) - Neural network decoder for near-term surface-code experiments [0.7100520098029438]
ニューラルネットワークデコーダは従来のデコーダに比べて論理的誤り率を低くすることができる。
これらのデコーダは物理エラー率に関する事前情報を必要としないため、高度に適応可能である。
論文 参考訳(メタデータ) (2023-07-06T20:31:25Z) - The END: An Equivariant Neural Decoder for Quantum Error Correction [73.4384623973809]
データ効率のよいニューラルデコーダを導入し、この問題の対称性を活用する。
本稿では,従来のニューラルデコーダに比べて精度の高い新しい同変アーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-04-14T19:46:39Z) - Differentiable bit-rate estimation for neural-based video codec
enhancement [2.592974861902384]
ニューラルネットワーク(NN)は、符号化されたビデオの前処理と後処理によって、標準的なビデオ圧縮を改善することができる。
NNトレーニングを最適にするためには、標準的なプロキシを、推定ビットレートと歪みのデリバティブを提供するプロキシに置き換える必要がある。
本稿では、エンド・ツー・エンドのニューラルコーデックのトレーニングで使用されるタイプに類似したビットレート推定のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2023-01-24T01:36:07Z) - Convolutional Neural Generative Coding: Scaling Predictive Coding to
Natural Images [79.07468367923619]
畳み込み型神経生成符号化(Conv-NGC)を開発した。
我々は、潜伏状態マップを段階的に洗練する柔軟な神経生物学的動機付けアルゴリズムを実装した。
本研究は,脳にインスパイアされたニューラル・システムによる再建と画像復調の課題に対する効果について検討する。
論文 参考訳(メタデータ) (2022-11-22T06:42:41Z) - High Fidelity Neural Audio Compression [92.4812002532009]
我々は、ニューラルネットワークを利用した最先端のリアルタイム、高忠実、オーディオを導入する。
ストリーミングエンコーダ-デコーダアーキテクチャと、エンドツーエンドでトレーニングされた量子化潜在空間で構成されている。
単一マルチスケール・スペクトログラム・アドバイザリーを用いて、トレーニングを簡素化し、高速化する。
論文 参考訳(メタデータ) (2022-10-24T17:52:02Z) - NAF: Neural Attenuation Fields for Sparse-View CBCT Reconstruction [79.13750275141139]
本稿では,スパースビューCBCT再構成のための新規かつ高速な自己教師型ソリューションを提案する。
所望の減衰係数は、3次元空間座標の連続関数として表現され、完全に接続されたディープニューラルネットワークによってパラメータ化される。
ハッシュ符号化を含む学習ベースのエンコーダが採用され、ネットワークが高周波の詳細をキャプチャするのに役立つ。
論文 参考訳(メタデータ) (2022-09-29T04:06:00Z) - Achieving Low Complexity Neural Decoders via Iterative Pruning [33.774970857450086]
ニューラルデコーダにおけるプルーフウェイトに対する反復的プルーニング手法について検討する。
ウェイト数が少ないデコーダは、レイテンシが低く、複雑さも低い。
これにより、計算能力に制限のあるモバイルや他のエッジデバイスに、ニューラルデコーダをより適合させることができる。
論文 参考訳(メタデータ) (2021-12-11T18:33:08Z) - SignalNet: A Low Resolution Sinusoid Decomposition and Estimation
Network [79.04274563889548]
本稿では,正弦波数を検出するニューラルネットワークアーキテクチャであるSignalNetを提案する。
基礎となるデータ分布と比較して,ネットワークの結果を比較するための最悪の学習しきい値を導入する。
シミュレーションでは、我々のアルゴリズムは常に3ビットデータのしきい値を超えることができるが、しばしば1ビットデータのしきい値を超えることはできない。
論文 参考訳(メタデータ) (2021-06-10T04:21:20Z) - Ps and Qs: Quantization-aware pruning for efficient low latency neural
network inference [56.24109486973292]
超低遅延アプリケーションのためのニューラルネットワークのトレーニング中の分級と量子化の相互作用を研究します。
量子化アウェアプルーニングは,タスクのプルーニングや量子化のみよりも計算効率のよいモデルであることが判明した。
論文 参考訳(メタデータ) (2021-02-22T19:00:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。