論文の概要: Perceptually Optimizing Deep Image Compression
- arxiv url: http://arxiv.org/abs/2007.02711v2
- Date: Thu, 9 Jul 2020 15:04:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-14 06:03:40.104725
- Title: Perceptually Optimizing Deep Image Compression
- Title(参考訳): 深部画像圧縮の知覚的最適化
- Authors: Li-Heng Chen and Christos G. Bampis and Zhi Li and Andrey Norkin and
Alan C. Bovik
- Abstract要約: 平均二乗誤差(MSE)と$ell_p$ノルムは、ニューラルネットワークの損失の測定で大きく支配されている。
本稿では,定量的知覚モデルに対して,画像解析ネットワークを最適化するための異なるプロキシ手法を提案する。
- 参考スコア(独自算出の注目度): 53.705543593594285
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mean squared error (MSE) and $\ell_p$ norms have largely dominated the
measurement of loss in neural networks due to their simplicity and analytical
properties. However, when used to assess visual information loss, these simple
norms are not highly consistent with human perception. Here, we propose a
different proxy approach to optimize image analysis networks against
quantitative perceptual models. Specifically, we construct a proxy network,
which mimics the perceptual model while serving as a loss layer of the
network.We experimentally demonstrate how this optimization framework can be
applied to train an end-to-end optimized image compression network. By building
on top of a modern deep image compression models, we are able to demonstrate an
averaged bitrate reduction of $28.7\%$ over MSE optimization, given a specified
perceptual quality (VMAF) level.
- Abstract(参考訳): 平均二乗誤差(MSE)と$\ell_p$ノルムは、その単純さと解析的性質から、ニューラルネットワークの損失の測定に大きく依存している。
しかしながら、視覚情報損失を評価するために使用される場合、これらの単純な規範は人間の知覚とあまり一致しない。
本稿では,定量的知覚モデルに対して,画像解析ネットワークを最適化するための異なるプロキシ手法を提案する。
具体的には、ネットワークの損失層として機能しながら知覚モデルを模倣したプロキシネットワークを構築し、この最適化フレームワークをエンドツーエンドの最適化画像圧縮ネットワークのトレーニングに適用する方法を実験的に実証する。
最新の深部画像圧縮モデルの上に構築することにより、特定の知覚品質(VMAF)レベルを考慮し、MSE最適化よりも平均28.7\%のビットレート削減を実証することができる。
関連論文リスト
- Semantic Ensemble Loss and Latent Refinement for High-Fidelity Neural Image Compression [58.618625678054826]
本研究は、最適な視覚的忠実度のために設計された強化されたニューラル圧縮手法を提案する。
我々は,洗練されたセマンティック・アンサンブル・ロス,シャルボニエ・ロス,知覚的損失,スタイル・ロス,非バイナリ・ディバイザ・ロスを組み込んだモデルを構築した。
実験により,本手法は神経画像圧縮の統計的忠実度を著しく向上させることが示された。
論文 参考訳(メタデータ) (2024-01-25T08:11:27Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - You Can Mask More For Extremely Low-Bitrate Image Compression [80.7692466922499]
近年,学習画像圧縮(lic)法は大きな進歩を遂げている。
licメソッドは、画像圧縮に不可欠な画像構造とテクスチャコンポーネントを明示的に探索することができない。
原画像の構造とテクスチャに基づいて可視パッチをサンプリングするDA-Maskを提案する。
極めて低ビットレート圧縮のために, lic と lic のエンドツーエンドを統一する最初のフレームワークである, 単純で効果的なマスク付き圧縮モデル (MCM) を提案する。
論文 参考訳(メタデータ) (2023-06-27T15:36:22Z) - Deep Optimal Transport: A Practical Algorithm for Photo-realistic Image Restoration [31.58365182858562]
事前学習したモデルの知覚的品質および/または平均二乗誤差(MSE)を制御できる画像復元アルゴリズムを提案する。
モデルによって復元された約1ダースの画像を考えると、新たな画像に対するモデルの知覚的品質と/またはMSEを、それ以上の訓練をすることなく大幅に向上させることができる。
論文 参考訳(メタデータ) (2023-06-04T12:21:53Z) - Compression with Bayesian Implicit Neural Representations [16.593537431810237]
本稿では,データに変分ニューラルネットワークをオーバーフィッティングし,相対エントロピー符号化を用いて近似後重みサンプルを圧縮し,量子化やエントロピー符号化を行う。
実験により,本手法は単純さを維持しつつ,画像および音声の圧縮に強い性能を発揮することが示された。
論文 参考訳(メタデータ) (2023-05-30T16:29:52Z) - Estimating the Resize Parameter in End-to-end Learned Image Compression [50.20567320015102]
本稿では,最近の画像圧縮モデルの速度歪みトレードオフをさらに改善する検索自由化フレームワークについて述べる。
提案手法により,Bjontegaard-Deltaレート(BD-rate)を最大10%向上させることができる。
論文 参考訳(メタデータ) (2022-04-26T01:35:02Z) - Blind Image Deconvolution Using Variational Deep Image Prior [4.92175281564179]
本稿では,視覚障害者のための新しい変分深度画像前処理(VDIP)を提案する。
VDIPは、潜時シャープ画像に付加的な手作り画像の先行を悪用し、各ピクセルの分布を近似して、最適以下の解を避ける。
実験により、生成された画像は、ベンチマークデータセットのオリジナルのDIPよりも品質が良いことが示された。
論文 参考訳(メタデータ) (2022-02-01T01:33:58Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Dynamic Proximal Unrolling Network for Compressive Sensing Imaging [29.00266254916676]
本稿では,DPUNetと呼ばれる動的近位アンローリングネットワークについて述べる。
具体的には、DPUNetは、勾配降下による埋め込み物理モデルと、学習された動的近位写像による画像のインポーティングの両方を活用できる。
実験結果から,提案したDPUNetは,サンプル比や雑音レベルの異なる複数のCSIモダリティを1つのモデルで効果的に処理できることがわかった。
論文 参考訳(メタデータ) (2021-07-23T03:04:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。