論文の概要: Learning End-to-End Lossy Image Compression: A Benchmark
- arxiv url: http://arxiv.org/abs/2002.03711v4
- Date: Fri, 26 Mar 2021 02:23:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-02 09:28:29.965458
- Title: Learning End-to-End Lossy Image Compression: A Benchmark
- Title(参考訳): エンド・ツー・エンドの損失画像圧縮の学習:ベンチマーク
- Authors: Yueyu Hu, Wenhan Yang, Zhan Ma, Jiaying Liu
- Abstract要約: まず,学習した画像の圧縮方法に関する総合的な文献調査を行う。
本稿では,最先端の学習画像圧縮手法のマイルストーンについて述べるとともに,既存の幅広い作品について概観し,その歴史的開発ルートについて考察する。
エントロピー推定と信号再構成のための粗大な超高次モデルを導入することにより、速度歪み性能の向上を実現する。
- 参考スコア(独自算出の注目度): 90.35363142246806
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image compression is one of the most fundamental techniques and commonly used
applications in the image and video processing field. Earlier methods built a
well-designed pipeline, and efforts were made to improve all modules of the
pipeline by handcrafted tuning. Later, tremendous contributions were made,
especially when data-driven methods revitalized the domain with their excellent
modeling capacities and flexibility in incorporating newly designed modules and
constraints. Despite great progress, a systematic benchmark and comprehensive
analysis of end-to-end learned image compression methods are lacking. In this
paper, we first conduct a comprehensive literature survey of learned image
compression methods. The literature is organized based on several aspects to
jointly optimize the rate-distortion performance with a neural network, i.e.,
network architecture, entropy model and rate control. We describe milestones in
cutting-edge learned image-compression methods, review a broad range of
existing works, and provide insights into their historical development routes.
With this survey, the main challenges of image compression methods are
revealed, along with opportunities to address the related issues with recent
advanced learning methods. This analysis provides an opportunity to take a
further step towards higher-efficiency image compression. By introducing a
coarse-to-fine hyperprior model for entropy estimation and signal
reconstruction, we achieve improved rate-distortion performance, especially on
high-resolution images. Extensive benchmark experiments demonstrate the
superiority of our model in rate-distortion performance and time complexity on
multi-core CPUs and GPUs. Our project website is available at
https://huzi96.github.io/compression-bench.html.
- Abstract(参考訳): 画像圧縮は、画像処理やビデオ処理の分野で最も基本的な技術であり、一般的に用いられる。
以前の手法はよく設計されたパイプラインを構築し、手作りのチューニングによってパイプラインのすべてのモジュールを改善する取り組みが行われた。
その後、特にデータ駆動の手法がドメインを再活性化し、新しく設計されたモジュールと制約を組み込む際の優れたモデリング能力と柔軟性によって、多大な貢献がなされた。
大きな進歩にもかかわらず、体系的なベンチマークとエンドツーエンドの学習画像圧縮手法の包括的な分析が欠如している。
本稿では,まず,学習画像圧縮法に関する総合的な文献調査を行う。
この文献は、ニューラルネットワーク、すなわちネットワークアーキテクチャ、エントロピーモデル、レート制御と組み合わせてレート歪み性能を最適化するいくつかの側面に基づいて構成されている。
本稿では,最先端の学習画像圧縮手法のマイルストーンについて述べるとともに,既存の幅広い作品について概観し,歴史的開発ルートについて考察する。
本調査では,画像圧縮手法の主な課題と,最近の先進的な学習手法による課題に対処する機会を明らかにする。
この分析は、高効率画像圧縮へのさらなる一歩を踏み出す機会を提供する。
エントロピー推定と信号再構成のための粗粒度超優先モデルを導入することで,特に高分解能画像において,速度分散性能の向上を実現する。
広範なベンチマーク実験により,マルチコアcpuとgpuのレート分散性能と時間複雑性において,モデルが優れていることが示された。
プロジェクトのwebサイトはhttps://huzi96.github.io/compression-bench.htmlで閲覧できます。
関連論文リスト
- FouriScale: A Frequency Perspective on Training-Free High-Resolution Image Synthesis [48.9652334528436]
本稿では、周波数領域解析の観点から、FouriScaleの革新的な学習不要アプローチを紹介する。
従来の拡散モデルの畳み込み層を,低域演算とともに拡張手法を組み込むことで置き換える。
提案手法は, 生成画像の構造的整合性と忠実度をバランスさせ, 任意のサイズ, 高解像度, 高品質な生成の驚くべき能力を実現する。
論文 参考訳(メタデータ) (2024-03-19T17:59:33Z) - Transferable Learned Image Compression-Resistant Adversarial Perturbations [66.46470251521947]
敵対的攻撃は容易に画像分類システムを破壊し、DNNベースの認識タスクの脆弱性を明らかにする。
我々は、学習した画像圧縮機を前処理モジュールとして利用する画像分類モデルをターゲットにした新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2024-01-06T03:03:28Z) - Efficient Contextformer: Spatio-Channel Window Attention for Fast
Context Modeling in Learned Image Compression [1.9249287163937978]
学習画像に対する変換器に基づく自己回帰的文脈モデルである、効率的なコンテキストフォーマ(eContextformer)を導入する。
並列コンテキストモデリングのためのパッチワイド、チェッカー、チャンネルワイドのグルーピングテクニックを融合する。
モデル複雑性が145倍、デコード速度が210Cx向上し、Kodak、CLI、Tecnickデータセット上での平均ビット節約を実現している。
論文 参考訳(メタデータ) (2023-06-25T16:29:51Z) - Reducing The Amortization Gap of Entropy Bottleneck In End-to-End Image
Compression [2.1485350418225244]
エンド・ツー・エンドのディープ・トレーニング可能なモデルは、ビデオや画像の従来の手作り圧縮技術の性能をほぼ上回っている。
本稿では,このアモート化ギャップを小さなコストで低減する,シンプルで効率的なインスタンスベースのパラメータ化手法を提案する。
論文 参考訳(メタデータ) (2022-09-02T11:43:45Z) - Lossy Image Compression with Quantized Hierarchical VAEs [33.173021636656465]
ResNet VAEはもともとデータ(画像)の分散モデリングのために設計された。
自然画像の損失圧縮における従来の手法より優れる、強力で効率的なモデルを提案する。
本モデルでは,画像を粗大に圧縮し,並列符号化と復号化をサポートする。
論文 参考訳(メタデータ) (2022-08-27T17:15:38Z) - Estimating the Resize Parameter in End-to-end Learned Image Compression [50.20567320015102]
本稿では,最近の画像圧縮モデルの速度歪みトレードオフをさらに改善する検索自由化フレームワークについて述べる。
提案手法により,Bjontegaard-Deltaレート(BD-rate)を最大10%向上させることができる。
論文 参考訳(メタデータ) (2022-04-26T01:35:02Z) - ELIC: Efficient Learned Image Compression with Unevenly Grouped
Space-Channel Contextual Adaptive Coding [9.908820641439368]
本研究では,最先端の速度と圧縮能力を実現するための効率的なモデルであるELICを提案する。
優れたパフォーマンスで、提案モデルは極めて高速なプレビューデコーディングとプログレッシブデコーディングもサポートする。
論文 参考訳(メタデータ) (2022-03-21T11:19:50Z) - Post-Training Quantization for Cross-Platform Learned Image Compression [15.67527732099067]
学習した画像圧縮が従来の画像符号化技術より優れていることが確認されている。
考慮すべき最も重要な問題の1つは、非決定論的計算である。
本稿では,学習後量子化の導入によってこの問題を解決することを提案する。
論文 参考訳(メタデータ) (2022-02-15T15:41:12Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - The Power of Triply Complementary Priors for Image Compressive Sensing [89.14144796591685]
本稿では,一対の相補的な旅先を含むLRD画像モデルを提案する。
次に、画像CSのためのRDモデルに基づく新しいハイブリッド・プラグイン・アンド・プレイ・フレームワークを提案する。
そこで,提案したH-based image CS問題の解法として,単純で効果的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-16T08:17:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。