論文の概要: The Gap Between Principle and Practice of Lossy Image Coding
- arxiv url: http://arxiv.org/abs/2501.12330v1
- Date: Tue, 21 Jan 2025 17:59:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-22 14:19:28.105711
- Title: The Gap Between Principle and Practice of Lossy Image Coding
- Title(参考訳): ロスシー画像符号化の原理と実践のギャップ
- Authors: Haotian Zhang, Dong Liu,
- Abstract要約: ロッシー画像符号化(Lossy image coding)は、主に画像の速度歪み関数によって拘束される計算技術である。
本稿では,シャノンの情報理論によって予測される理想的速度歪み関数と,最先端の学習画像符号化方式によって達成される経験的速度歪み関数とのギャップを同定する。
- 参考スコア(独自算出の注目度): 13.348068258090379
- License:
- Abstract: Lossy image coding is the art of computing that is principally bounded by the image's rate-distortion function. This bound, though never accurately characterized, has been approached practically via deep learning technologies in recent years. Indeed, learned image coding schemes allow direct optimization of the joint rate-distortion cost, thereby outperforming the handcrafted image coding schemes by a large margin. Still, it is observed that there is room for further improvement in the rate-distortion performance of learned image coding. In this article, we identify the gap between the ideal rate-distortion function forecasted by Shannon's information theory and the empirical rate-distortion function achieved by the state-of-the-art learned image coding schemes, revealing that the gap is incurred by five different effects: modeling effect, approximation effect, amortization effect, digitization effect, and asymptotic effect. We design simulations and experiments to quantitively evaluate the last three effects, which demonstrates the high potential of future lossy image coding technologies.
- Abstract(参考訳): ロッシー画像符号化(Lossy image coding)は、主に画像の速度歪み関数によって拘束される計算技術である。
この境界は、正確には特徴付けられていないが、近年ではディープラーニング技術を通じて実質的にアプローチされている。
実際、学習された画像符号化スキームは、ジョイントレート・歪みコストの直接最適化を可能にし、手作りの画像符号化スキームを大きなマージンで上回る。
それでも、学習した画像符号化の速度歪み性能がさらに向上する余地があることが観察された。
本稿では、シャノンの情報理論によって予測される理想的速度歪み関数と、最先端の学習画像符号化方式によって達成される経験的速度歪み関数とのギャップを同定し、そのギャップがモデリング効果、近似効果、償却効果、デジタル化効果、漸近効果の5つの異なる効果によって生じることを明らかにする。
我々は,この3つの効果を定量的に評価するためにシミュレーションと実験を設計し,将来の損失画像符号化技術の可能性を示す。
関連論文リスト
- WiNet: Wavelet-based Incremental Learning for Efficient Medical Image Registration [68.25711405944239]
深部画像登録は異常な精度と高速な推測を示した。
近年の進歩は、粗大から粗大の方法で密度変形場を推定するために、複数のカスケードまたはピラミッドアーキテクチャを採用している。
本稿では,様々なスケールにわたる変位/速度場に対して,スケールワイブレット係数を漸進的に推定するモデル駆動WiNetを提案する。
論文 参考訳(メタデータ) (2024-07-18T11:51:01Z) - Efficient Degradation-aware Any Image Restoration [83.92870105933679]
我々は,低ランク体制下での学習者(DaLe)を用いた効率的なオールインワン画像復元システムである textitDaAIR を提案する。
モデルキャパシティを入力劣化に動的に割り当てることにより、総合学習と特定の学習を統合した効率的な復調器を実現する。
論文 参考訳(メタデータ) (2024-05-24T11:53:27Z) - Semantic Ensemble Loss and Latent Refinement for High-Fidelity Neural Image Compression [58.618625678054826]
本研究は、最適な視覚的忠実度のために設計された強化されたニューラル圧縮手法を提案する。
我々は,洗練されたセマンティック・アンサンブル・ロス,シャルボニエ・ロス,知覚的損失,スタイル・ロス,非バイナリ・ディバイザ・ロスを組み込んだモデルを構築した。
実験により,本手法は神経画像圧縮の統計的忠実度を著しく向上させることが示された。
論文 参考訳(メタデータ) (2024-01-25T08:11:27Z) - Enhancing a Convolutional Autoencoder with a Quantum Approximate
Optimization Algorithm for Image Noise Reduction [0.0]
多くの畳み込みオートエンコーダアルゴリズムは、画像の復調に有効であることが証明されている。
本研究では,QCAE(Quantum Convolutional Autoencoder)法を提案する。
論文 参考訳(メタデータ) (2024-01-12T04:35:55Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - Learning Discriminative Shrinkage Deep Networks for Image Deconvolution [122.79108159874426]
本稿では,これらの用語を暗黙的にモデル化する識別的縮小関数を学習することで,効果的に非盲検デコンボリューション手法を提案する。
実験結果から,提案手法は最先端の手法に対して,効率と精度の点で好適に動作することがわかった。
論文 参考訳(メタデータ) (2021-11-27T12:12:57Z) - A Deep Ordinal Distortion Estimation Approach for Distortion Rectification [62.72089758481803]
より高精度なパラメータを効率良く得る新しい歪み補正手法を提案する。
本研究では, 局所言語関連推定ネットワークを設計し, 順序歪みを学習し, 現実的な歪み分布を近似する。
歪み情報の冗長性を考慮すると,本手法では歪み画像の一部のみを用いて順序方向の歪み推定を行う。
論文 参考訳(メタデータ) (2020-07-21T10:03:42Z) - Improving Inference for Neural Image Compression [31.999462074510305]
State-of-the-art method build on Hierarchical variational autoencoders to predict a compressible latent representation of each data point。
従来の手法では性能を制限した3つの近似ギャップを同定する。
本稿では,これら3つの制約のそれぞれについて,反復的推論に関する考え方に基づく対策を提案する。
論文 参考訳(メタデータ) (2020-06-07T19:26:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。