論文の概要: Rethinking Learned Image Compression: Context is All You Need
- arxiv url: http://arxiv.org/abs/2407.11590v1
- Date: Tue, 16 Jul 2024 10:50:10 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-17 15:32:51.975139
- Title: Rethinking Learned Image Compression: Context is All You Need
- Title(参考訳): 学習した画像の圧縮を再考する
- Authors: Jixiang Luo,
- Abstract要約: 本稿では,エンコーダ,デコーダ,コンテキストモデルのスケーリングパラメータの有効性を解析する。
文脈を最適化することにより,PSNRの達成率と最先端性能をさらに向上させ,VVCよりもBD-RATEの方が14.39%向上したことを示す。
- 参考スコア(独自算出の注目度): 0.6345523830122168
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Since LIC has made rapid progress recently compared to traditional methods, this paper attempts to discuss the question about 'Where is the boundary of Learned Image Compression(LIC)?' with regard to subjective matrics. Thus this paper splits the above problem into two sub-problems:1)Where is the boundary of rate-distortion performance of PSNR? 2)How to further improve the compression gain and achieve the boundary? Therefore this paper analyzes the effectiveness of scaling parameters for encoder, decoder and context model, which are the three components of LIC. Then we conclude that scaling for LIC is to scale for context model and decoder within LIC. Extensive experiments demonstrate that overfitting can actually serve as an effective context. By optimizing the context, this paper further improves PSNR and achieves state-of-the-art performance, showing a performance gain of 14.39% with BD-RATE over VVC.
- Abstract(参考訳): 近年,licは従来の方法と比較して急速に進歩しているため,本論文では「学習画像圧縮(lic)の境界線はどこにあるのか」という課題を主観的マストリクスで論じる。
以上の問題を2つのサブプロブレムに分割する: 1)PSNRの速度歪み性能の境界は何か?
2) 圧縮ゲインをさらに改善し、境界を達成するにはどうすればいいのか?
そこで本研究では,エンコーダ,デコーダ,コンテキストモデルのスケーリングパラメータの有効性を解析する。
そして、licのスケーリングは、lic内のコンテキストモデルとデコーダのスケーリングである、と結論付けます。
大規模な実験は、オーバーフィッティングが実際に効果的な文脈として機能することを示した。
文脈を最適化することにより、PSNRをさらに改善し、最先端のパフォーマンスを実現し、VVCよりもBD-RATEの方が14.39%向上したことを示す。
関連論文リスト
- Causal Context Adjustment Loss for Learned Image Compression [72.7300229848778]
近年,学習画像圧縮(lic)技術は,特にRD性能の点で従来の手法を上回りつつある。
現在の技術のほとんどは、自己回帰エントロピーモデルを備えたVAEベースで、デコードされた因果コンテキストを利用してRD性能を向上する。
本稿では,提案した因果文脈調整損失を用いて因果文脈を的確に調整する方法を初めて検討する。
論文 参考訳(メタデータ) (2024-10-07T09:08:32Z) - Corner-to-Center Long-range Context Model for Efficient Learned Image
Compression [70.0411436929495]
学習された画像圧縮のフレームワークでは、コンテキストモデルは潜在表現間の依存関係をキャプチャする上で重要な役割を果たす。
本研究では,textbfCorner-to-Center 変換器を用いたコンテキストモデル (C$3$M) を提案する。
また,解析および合成変換における受容場を拡大するために,エンコーダ/デコーダのLong-range Crossing Attention Module (LCAM) を用いる。
論文 参考訳(メタデータ) (2023-11-29T21:40:28Z) - You Can Mask More For Extremely Low-Bitrate Image Compression [80.7692466922499]
近年,学習画像圧縮(lic)法は大きな進歩を遂げている。
licメソッドは、画像圧縮に不可欠な画像構造とテクスチャコンポーネントを明示的に探索することができない。
原画像の構造とテクスチャに基づいて可視パッチをサンプリングするDA-Maskを提案する。
極めて低ビットレート圧縮のために, lic と lic のエンドツーエンドを統一する最初のフレームワークである, 単純で効果的なマスク付き圧縮モデル (MCM) を提案する。
論文 参考訳(メタデータ) (2023-06-27T15:36:22Z) - Leveraging progressive model and overfitting for efficient learned image
compression [14.937446839215868]
マルチスケールプログレッシブ(MSP)確率モデルと潜在表現オーバーフィッティング(LOF)技術を用いた強力で柔軟なlicフレームワークを提案する。
事前定義されたプロファイルの異なるフレームワークでは、圧縮効率と計算複雑性のバランスポイントを達成できる。
実験の結果,提案フレームワークはVVC/H.266標準よりも2.5%,1.0%,1.3%Bjontegaardデルタビットレート(BDレート)の低減を実現している。
論文 参考訳(メタデータ) (2022-10-08T21:54:58Z) - Learning True Rate-Distortion-Optimization for End-To-End Image
Compression [59.816251613869376]
速度歪みの最適化は、従来の画像圧縮とビデオ圧縮の重要な部分である。
本稿では,RDO結果の低複雑さ推定をトレーニングに導入することにより,トレーニングの強化を図る。
我々は以前のRDONetモデルに比べてMS-SSIMで平均19.6%のレートセーブを実現し、従来のディープイメージコーダに比べて27.3%のレートセーブを実現した。
論文 参考訳(メタデータ) (2022-01-05T13:02:00Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Checkerboard Context Model for Efficient Learned Image Compression [6.376339829493938]
学習された画像圧縮のために、オートレグレッシブコンテキストモデルは、レート歪み(RD)のパフォーマンスを改善するのに効果的である。
本稿では,並列化可能なチェッカーボードコンテキストモデル(CCM)を提案する。
実験では,復号処理を40回以上高速化し,ほぼ同じ速度歪み性能で計算効率を大幅に向上させた。
論文 参考訳(メタデータ) (2021-03-29T03:25:41Z) - Learned Block-based Hybrid Image Compression [33.44942603425436]
学習画像圧縮に関する最近の研究は、完全な解像度で符号化および復号処理を行う。
フルレゾリューション推論は、GPUリソースが限られているメモリ外問題(OOM)を引き起こすことが多い。
本稿では,学習ブロックベースのハイブリッド画像圧縮フレームワークを提供する。
論文 参考訳(メタデータ) (2020-12-17T12:47:39Z) - Quantization Guided JPEG Artifact Correction [69.04777875711646]
我々はJPEGファイル量子化行列を用いたアーティファクト修正のための新しいアーキテクチャを開発した。
これにより、特定の品質設定のためにトレーニングされたモデルに対して、単一のモデルで最先端のパフォーマンスを達成できます。
論文 参考訳(メタデータ) (2020-04-17T00:10:08Z) - Saliency Driven Perceptual Image Compression [6.201592931432016]
画像圧縮技術の性能評価にはMS-SSIMやPSNRなどの評価指標が不十分であることを示す。
画像圧縮に特有な知覚的類似性データに基づいて学習する新しい指標を提案する。
このモデルは視覚的に優れた画像を生成するだけでなく、その後のコンピュータビジョンタスクに優れた性能を与える。
論文 参考訳(メタデータ) (2020-02-12T13:43:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。