論文の概要: Implicit Neural Representations for Image Compression
- arxiv url: http://arxiv.org/abs/2112.04267v1
- Date: Wed, 8 Dec 2021 13:02:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-09 14:27:53.296492
- Title: Implicit Neural Representations for Image Compression
- Title(参考訳): 画像圧縮のための暗黙的ニューラル表現
- Authors: Yannick Str\"umpler, Janis Postels, Ren Yang, Luc van Gool, Federico
Tombari
- Abstract要約: Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
- 参考スコア(独自算出の注目度): 103.78615661013623
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently Implicit Neural Representations (INRs) gained attention as a novel
and effective representation for various data types. Thus far, prior work
mostly focused on optimizing their reconstruction performance. This work
investigates INRs from a novel perspective, i.e., as a tool for image
compression. To this end, we propose the first comprehensive compression
pipeline based on INRs including quantization, quantization-aware retraining
and entropy coding. Encoding with INRs, i.e. overfitting to a data sample, is
typically orders of magnitude slower. To mitigate this drawback, we leverage
meta-learned initializations based on MAML to reach the encoding in fewer
gradient updates which also generally improves rate-distortion performance of
INRs. We find that our approach to source compression with INRs vastly
outperforms similar prior work, is competitive with common compression
algorithms designed specifically for images and closes the gap to
state-of-the-art learned approaches based on Rate-Distortion Autoencoders.
Moreover, we provide an extensive ablation study on the importance of
individual components of our method which we hope facilitates future research
on this novel approach to image compression.
- Abstract(参考訳): 最近、暗黙的ニューラルネットワーク表現(inrs)は、様々なデータタイプの新しい効果的な表現として注目を集めた。
これまでの作業は主に再建性能の最適化に重点を置いていた。
本研究は、画像圧縮のためのツールとして、新しい視点からINRを調査する。
そこで本研究では, 量子化, 量子化アウェアリトレーニング, エントロピー符号化などのinrsに基づく最初の総合圧縮パイプラインを提案する。
データサンプルに過度に適合するINRによるエンコーディングは、典型的には桁違い遅い。
この欠点を軽減するために、MAMLに基づくメタ学習初期化を利用して、より少ない勾配更新のエンコーディングに到達し、INRの速度歪み性能も向上する。
inrsによるソース圧縮のアプローチは,画像専用に設計された一般的な圧縮アルゴリズムと競合しており,レート分散オートエンコーダに基づく最先端学習アプローチとのギャップを縮めている。
さらに,本手法の個別成分の重要性について広範なアブレーション研究を行い,新たな画像圧縮手法の今後の研究に期待する。
関連論文リスト
- Streaming Neural Images [56.41827271721955]
Inlicit Neural Representations (INR) は信号表現の新しいパラダイムであり、画像圧縮にかなりの関心を集めている。
本研究では,INRの計算コスト,不安定な性能,堅牢性などの限界要因について検討する。
論文 参考訳(メタデータ) (2024-09-25T17:51:20Z) - UniCompress: Enhancing Multi-Data Medical Image Compression with Knowledge Distillation [59.3877309501938]
Inlicit Neural Representation (INR) ネットワークは、その柔軟な圧縮比のため、顕著な汎用性を示している。
周波数領域情報を含むコードブックをINRネットワークへの事前入力として導入する。
これにより、INRの表現力が向上し、異なる画像ブロックに対して特異な条件付けが提供される。
論文 参考訳(メタデータ) (2024-05-27T05:52:13Z) - Neural Image Compression with Quantization Rectifier [7.097091519502871]
我々は,画像特徴相関を利用した画像圧縮のための新しい量子化法(QR)を開発し,量子化の影響を緩和する。
提案手法は,量子化された特徴量から未知の特徴量を予測するニューラルネットワークアーキテクチャを設計する。
評価では、QRを最先端のニューラルイメージコーデックに統合し、広く使用されているKodakベンチマークの強化モデルとベースラインを比較する。
論文 参考訳(メタデータ) (2024-03-25T22:26:09Z) - Semantic Ensemble Loss and Latent Refinement for High-Fidelity Neural Image Compression [58.618625678054826]
本研究は、最適な視覚的忠実度のために設計された強化されたニューラル圧縮手法を提案する。
我々は,洗練されたセマンティック・アンサンブル・ロス,シャルボニエ・ロス,知覚的損失,スタイル・ロス,非バイナリ・ディバイザ・ロスを組み込んだモデルを構築した。
実験により,本手法は神経画像圧縮の統計的忠実度を著しく向上させることが示された。
論文 参考訳(メタデータ) (2024-01-25T08:11:27Z) - Beyond Learned Metadata-based Raw Image Reconstruction [86.1667769209103]
生画像は、線形性や微細な量子化レベルなど、sRGB画像に対して明確な利点がある。
ストレージの要求が大きいため、一般ユーザからは広く採用されていない。
本稿では,メタデータとして,潜在空間におけるコンパクトな表現を学習する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-21T06:59:07Z) - Reducing The Amortization Gap of Entropy Bottleneck In End-to-End Image
Compression [2.1485350418225244]
エンド・ツー・エンドのディープ・トレーニング可能なモデルは、ビデオや画像の従来の手作り圧縮技術の性能をほぼ上回っている。
本稿では,このアモート化ギャップを小さなコストで低減する,シンプルで効率的なインスタンスベースのパラメータ化手法を提案する。
論文 参考訳(メタデータ) (2022-09-02T11:43:45Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - Modeling Image Quantization Tradeoffs for Optimal Compression [0.0]
ロスシー圧縮アルゴリズムは、圧縮率を上げるために高周波データを定量化することでトレードオフを狙う。
本稿では,Deep Learningとminimax損失関数を用いた量子化テーブルの最適化手法を提案する。
論文 参考訳(メタデータ) (2021-12-14T07:35:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。