論文の概要: Multi-Sample Training for Neural Image Compression
- arxiv url: http://arxiv.org/abs/2209.13834v1
- Date: Wed, 28 Sep 2022 04:42:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 17:15:19.620597
- Title: Multi-Sample Training for Neural Image Compression
- Title(参考訳): ニューラル画像圧縮のためのマルチサンプルトレーニング
- Authors: Tongda Xu, Yan Wang, Dailan He, Chenjian Gao, Han Gao, Kunzan Liu,
Hongwei Qin
- Abstract要約: 現在の最先端(ソータ)法では、一様後部を近似量子化雑音とし、単サンプルパスワイズ推定器を用いて証拠下界(ELBO)の勾配を近似する。
ELBOよりも厳密で,サンプルサイズの増加とともにログ可能性に収束するマルチサンプル重み付きオートエンコーダ(IWAE)ターゲットを用いたNIC訓練を提案する。
我々のMS-NICはプラグアンドプレイであり、他のニューラル圧縮タスクに容易に拡張できる。
- 参考スコア(独自算出の注目度): 11.167668701825134
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper considers the problem of lossy neural image compression (NIC).
Current state-of-the-art (sota) methods adopt uniform posterior to approximate
quantization noise, and single-sample pathwise estimator to approximate the
gradient of evidence lower bound (ELBO). In this paper, we propose to train NIC
with multiple-sample importance weighted autoencoder (IWAE) target, which is
tighter than ELBO and converges to log likelihood as sample size increases.
First, we identify that the uniform posterior of NIC has special properties,
which affect the variance and bias of pathwise and score function estimators of
the IWAE target. Moreover, we provide insights on a commonly adopted trick in
NIC from gradient variance perspective. Based on those analysis, we further
propose multiple-sample NIC (MS-NIC), an enhanced IWAE target for NIC.
Experimental results demonstrate that it improves sota NIC methods. Our MS-NIC
is plug-and-play, and can be easily extended to other neural compression tasks.
- Abstract(参考訳): 本稿では、損失のあるニューラルイメージ圧縮(NIC)の問題について考察する。
現在の最先端(ソータ)法では、一様後方から量子化ノイズを近似し、単一サンプルパスワイズ推定器を用いて証拠下界(ELBO)の勾配を近似する。
本稿では,多サンプル重み付きオートエンコーダ(IWAE)ターゲットを用いたNICのトレーニングを提案する。
まず、NICの均一な後部は特別な特性を有しており、IWAEターゲットのパスワイドおよびスコア関数推定器のばらつきとバイアスに影響を与える。
さらに、勾配分散の観点から、NICにおいて一般的に採用されているトリックについての洞察を提供する。
これらの分析に基づいて、NICの強化されたIWAEターゲットであるMulti-Sample NIC (MS-NIC)を提案する。
実験により,ソータNIC法の改善が示された。
我々のMS-NICはプラグアンドプレイであり、他のニューラル圧縮タスクに容易に拡張できる。
関連論文リスト
- Controlling Rate, Distortion, and Realism: Towards a Single Comprehensive Neural Image Compression Model [4.096453902709292]
異なるビットレートで画像を圧縮する可変レート生成NICモデルを提案する。
提案手法を取り入れることで,ビットレート,歪み,リアリズムを1つのモデルで調整することができる。
我々の手法は、最先端の単一レート NIC モデルの性能と一致するか、上回っている。
論文 参考訳(メタデータ) (2024-05-27T04:22:25Z) - Theoretical Bound-Guided Hierarchical VAE for Neural Image Codecs [11.729071258457138]
近年の研究では、変分オートエンコーダ(VAE)と速度歪み理論の間に有意な関係があることが示されている。
VAEは画像の情報レート歪み関数の理論上界を推定する。
このギャップを狭めるために,ニューラルネットワークのための理論的境界誘導型階層型VAE(BG-VAE)を提案する。
論文 参考訳(メタデータ) (2024-03-27T13:11:34Z) - Slicer Networks [8.43960865813102]
医用画像解析のための新しいアーキテクチャであるスライダネットワークを提案する。
スライダ・ネットワークは、スプレイティング・ブルーリング・スライシング・プロセスを通じて、機能マップを戦略的に洗練し、アップサンプルする。
異なる医療画像アプリケーションにわたる実験により、スライカーネットワークの精度と効率が向上したことが確認された。
論文 参考訳(メタデータ) (2024-01-18T09:50:26Z) - Deep Multi-Threshold Spiking-UNet for Image Processing [51.88730892920031]
本稿では,SNN(Spike Neural Networks)とU-Netアーキテクチャを組み合わせた,画像処理のためのスパイキング-UNetの概念を紹介する。
効率的なスパイキング-UNetを実現するためには,スパイクによる高忠実度情報伝播の確保と,効果的なトレーニング戦略の策定という2つの課題に直面する。
実験の結果,画像のセグメンテーションとデノイングにおいて,スパイキングUNetは非スパイキングと同等の性能を発揮することがわかった。
論文 参考訳(メタデータ) (2023-07-20T16:00:19Z) - Neural Image Compression: Generalization, Robustness, and Spectral
Biases [16.55855347335981]
ニューラルイメージ圧縮(NIC)の最近の進歩は、古典的コーデックを上回り始めているモデルを生み出している。
あらゆる機械学習システムが広く採用されるには、見当たらない分散シフトを一般化(かつ堅牢に)する必要がある。
本稿では,画像圧縮方式のアウト・オブ・ディストリビューション性能を評価するためのベンチマークスイートを提案する。
論文 参考訳(メタデータ) (2023-07-17T17:14:17Z) - Modality-Agnostic Variational Compression of Implicit Neural
Representations [96.35492043867104]
Inlicit Neural Representation (INR) としてパラメータ化されたデータの関数的ビューに基づくモーダリティ非依存型ニューラル圧縮アルゴリズムを提案する。
潜時符号化と疎性の間のギャップを埋めて、ソフトゲーティング機構に非直線的にマッピングされたコンパクト潜時表現を得る。
このような潜在表現のデータセットを得た後、ニューラル圧縮を用いてモーダリティ非依存空間におけるレート/歪みトレードオフを直接最適化する。
論文 参考訳(メタデータ) (2023-01-23T15:22:42Z) - Cluster-Promoting Quantization with Bit-Drop for Minimizing Network
Quantization Loss [61.26793005355441]
クラスタ・プロモーティング・量子化(CPQ)は、ニューラルネットワークに最適な量子化グリッドを見つける。
DropBitsは、ニューロンの代わりにランダムにビットをドロップする標準のドロップアウト正規化を改訂する新しいビットドロップ技術である。
本手法を様々なベンチマークデータセットとネットワークアーキテクチャ上で実験的に検証する。
論文 参考訳(メタデータ) (2021-09-05T15:15:07Z) - Rate Distortion Characteristic Modeling for Neural Image Compression [59.25700168404325]
エンドツーエンドの最適化機能は、ニューラルイメージ圧縮(NIC)の優れた損失圧縮性能を提供する。
異なるモデルは、R-D空間の異なる点に到達するために訓練される必要がある。
深層ネットワークと統計モデルを用いてNICのR-D挙動を記述するために,本質的な数学的関数の定式化に努めている。
論文 参考訳(メタデータ) (2021-06-24T12:23:05Z) - Deep Networks for Direction-of-Arrival Estimation in Low SNR [89.45026632977456]
我々は,真の配列多様体行列の変異チャネルデータから学習した畳み込みニューラルネットワーク(CNN)を導入する。
我々は低SNR体制でCNNを訓練し、すべてのSNRでDoAを予測する。
私たちの堅牢なソリューションは、ワイヤレスアレイセンサーから音響マイクロフォンやソナーまで、いくつかの分野に適用できます。
論文 参考訳(メタデータ) (2020-11-17T12:52:18Z) - Multi-Scale Positive Sample Refinement for Few-Shot Object Detection [61.60255654558682]
Few-shot Object Detection (FSOD) は、ディテクターがトレーニングインスタンスをほとんど持たない未確認のクラスに適応するのに役立つ。
FSODにおけるオブジェクトスケールを拡張化するためのMPSR(Multi-scale Positive Sample Refinement)アプローチを提案する。
MPSRは、オブジェクトピラミッドとして多スケールの正のサンプルを生成し、様々なスケールで予測を洗練させる。
論文 参考訳(メタデータ) (2020-07-18T09:48:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。