論文の概要: High-Fidelity Generative Image Compression
- arxiv url: http://arxiv.org/abs/2006.09965v3
- Date: Fri, 23 Oct 2020 08:55:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-19 20:47:47.832779
- Title: High-Fidelity Generative Image Compression
- Title(参考訳): 高忠実な生成画像圧縮
- Authors: Fabian Mentzer, George Toderici, Michael Tschannen, Eirikur Agustsson
- Abstract要約: そこで我々は, ジェネリック・アドリアル・ネットワークと学習圧縮を併用して, 最先端の縮退型圧縮システムを得る方法について検討した。
特に,正規化レイヤ,ジェネレータおよび識別器アーキテクチャ,トレーニング戦略,知覚的損失について検討する。
- 参考スコア(独自算出の注目度): 39.04379573099481
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We extensively study how to combine Generative Adversarial Networks and
learned compression to obtain a state-of-the-art generative lossy compression
system. In particular, we investigate normalization layers, generator and
discriminator architectures, training strategies, as well as perceptual losses.
In contrast to previous work, i) we obtain visually pleasing reconstructions
that are perceptually similar to the input, ii) we operate in a broad range of
bitrates, and iii) our approach can be applied to high-resolution images. We
bridge the gap between rate-distortion-perception theory and practice by
evaluating our approach both quantitatively with various perceptual metrics,
and with a user study. The study shows that our method is preferred to previous
approaches even if they use more than 2x the bitrate.
- Abstract(参考訳): 本研究では, 生成的逆数ネットワークと学習的圧縮を併用して, 最先端な生成的損失圧縮システムを実現する方法について検討した。
特に,正規化レイヤ,ジェネレータおよび識別器アーキテクチャ,トレーニング戦略,知覚的損失について検討する。
以前の作品とは対照的に
一 入力と知覚的に類似した視覚的に好感的な再構成を得る。
二 幅広いビットレートで操作し、
iii)この手法は高解像度画像に適用できる。
我々は,様々な知覚指標とユーザスタディの両方を用いて,我々のアプローチを定量的に評価することで,レート歪知覚理論と実践のギャップを埋める。
本研究は,ビットレートが2倍以上であっても,従来の手法よりも好まれることを示す。
関連論文リスト
- Rate-Distortion-Cognition Controllable Versatile Neural Image Compression [47.72668401825835]
速度歪み認識制御可能な多目的画像圧縮法を提案する。
本手法は, 良好なICM性能とフレキシブルレート・ディストーション・コグニテーション制御を実現する。
論文 参考訳(メタデータ) (2024-07-16T13:17:51Z) - Semantic Ensemble Loss and Latent Refinement for High-Fidelity Neural Image Compression [58.618625678054826]
本研究は、最適な視覚的忠実度のために設計された強化されたニューラル圧縮手法を提案する。
我々は,洗練されたセマンティック・アンサンブル・ロス,シャルボニエ・ロス,知覚的損失,スタイル・ロス,非バイナリ・ディバイザ・ロスを組み込んだモデルを構築した。
実験により,本手法は神経画像圧縮の統計的忠実度を著しく向上させることが示された。
論文 参考訳(メタデータ) (2024-01-25T08:11:27Z) - Transferable Learned Image Compression-Resistant Adversarial Perturbations [66.46470251521947]
敵対的攻撃は容易に画像分類システムを破壊し、DNNベースの認識タスクの脆弱性を明らかにする。
我々は、学習した画像圧縮機を前処理モジュールとして利用する画像分類モデルをターゲットにした新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2024-01-06T03:03:28Z) - Machine Perception-Driven Image Compression: A Layered Generative
Approach [32.23554195427311]
階層型生成画像圧縮モデルを提案する。
タスクに依存しない学習に基づく圧縮モデルを提案し、様々な圧縮されたドメインベースの分析タスクを効果的にサポートする。
圧縮比、再構成画像品質、下流知覚性能の最良のバランス点を得るために、共同最適化スケジュールを採用する。
論文 参考訳(メタデータ) (2023-04-14T02:12:38Z) - Compressive Ptychography using Deep Image and Generative Priors [9.658250977094562]
Ptychographyは、ナノメートルスケールでサンプルの非侵襲的なイメージングを可能にする、よく確立されたコヒーレント回折イメージング技術である。
Ptychographyの最大の制限は、サンプルの機械的スキャンによる長いデータ取得時間である。
本稿では,深部画像先行と深部画像先行とを組み合わせた生成モデルを提案する。
論文 参考訳(メタデータ) (2022-05-05T02:18:26Z) - Recognition-Aware Learned Image Compression [0.5801044612920815]
本稿では,タスク固有の損失と並行して,速度歪み損失を最適化する認識認識型学習圧縮手法を提案する。
提案手法は,BPGなどの従来の手法と比較して,同等値での認識精度が26%向上する。
論文 参考訳(メタデータ) (2022-02-01T03:33:51Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Deblurring via Stochastic Refinement [85.42730934561101]
条件付き拡散モデルに基づくブラインドデブロアリングのための代替フレームワークを提案する。
提案手法は,PSNRなどの歪み指標の点で競合する。
論文 参考訳(メタデータ) (2021-12-05T04:36:09Z) - Improving Inference for Neural Image Compression [31.999462074510305]
State-of-the-art method build on Hierarchical variational autoencoders to predict a compressible latent representation of each data point。
従来の手法では性能を制限した3つの近似ギャップを同定する。
本稿では,これら3つの制約のそれぞれについて,反復的推論に関する考え方に基づく対策を提案する。
論文 参考訳(メタデータ) (2020-06-07T19:26:37Z) - Learning End-to-End Lossy Image Compression: A Benchmark [90.35363142246806]
まず,学習した画像の圧縮方法に関する総合的な文献調査を行う。
本稿では,最先端の学習画像圧縮手法のマイルストーンについて述べるとともに,既存の幅広い作品について概観し,その歴史的開発ルートについて考察する。
エントロピー推定と信号再構成のための粗大な超高次モデルを導入することにより、速度歪み性能の向上を実現する。
論文 参考訳(メタデータ) (2020-02-10T13:13:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。