論文の概要: Deep learning-based Edge-aware pre and post-processing methods for JPEG
compressed images
- arxiv url: http://arxiv.org/abs/2104.04926v2
- Date: Thu, 2 Nov 2023 15:35:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-03 18:45:59.242022
- Title: Deep learning-based Edge-aware pre and post-processing methods for JPEG
compressed images
- Title(参考訳): JPEG圧縮画像の深層学習に基づくエッジ認識前処理法
- Authors: Dipti Mishra, Satish Kumar Singh, Rajat Kumar Singh
- Abstract要約: 本稿では,前処理と後処理の深いCNN間の標準を包含する学習ベース圧縮方式を提案する。
本稿では, 圧縮圧縮ネットワークを利用した先行手法の改良を, (a) 従来の作業でよく発生するぼやけを防止するエッジ認識損失関数, (b) 処理後処理のための超解像畳み込みニューラルネットワーク, および, 対応する前処理ネットワークを導入し, レート歪み性能の向上を図る。
- 参考スコア(独自算出の注目度): 7.803786205476811
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a learning-based compression scheme that envelopes a standard
codec between pre and post-processing deep CNNs. Specifically, we demonstrate
improvements over prior approaches utilizing a compression-decompression
network by introducing: (a) an edge-aware loss function to prevent blurring
that is commonly occurred in prior works & (b) a super-resolution convolutional
neural network (CNN) for post-processing along with a corresponding
pre-processing network for improved rate-distortion performance in the low rate
regime. The algorithm is assessed on a variety of datasets varying from low to
high resolution namely Set 5, Set 7, Classic 5, Set 14, Live 1, Kodak, General
100, CLIC 2019. When compared to JPEG, JPEG2000, BPG, and recent CNN approach,
the proposed algorithm contributes significant improvement in PSNR with an
approximate gain of 20.75%, 8.47%, 3.22%, 3.23% and 24.59%, 14.46%, 10.14%,
8.57% at low and high bit-rates respectively. Similarly, this improvement in
MS-SSIM is approximately 71.43%, 50%, 36.36%, 23.08%, 64.70% and 64.47%,
61.29%, 47.06%, 51.52%, 16.28% at low and high bit-rates respectively. With
CLIC 2019 dataset, PSNR is found to be superior with approximately 16.67%,
10.53%, 6.78%, and 24.62%, 17.39%, 14.08% at low and high bit-rates
respectively, over JPEG2000, BPG, and recent CNN approach. Similarly, the
MS-SSIM is found to be superior with approximately 72%, 45.45%, 39.13%, 18.52%,
and 71.43%, 50%, 41.18%, 17.07% at low and high bit-rates respectively,
compared to the same approaches. A similar type of improvement is achieved with
other datasets also.
- Abstract(参考訳): 本稿では,前処理と後処理の深いCNN間の標準コーデックを包含する学習ベース圧縮方式を提案する。
具体的には,圧縮圧縮ネットワークを用いた先行手法の改良について述べる。
(a)先行作品でよく発生するぼやけを防ぐためのエッジアウェアロス機能
b)低レート状態における速度歪み性能を改善するために,処理後処理のための超解像畳み込みニューラルネットワーク(CNN)と対応する前処理ネットワークを併用する。
このアルゴリズムは、Set 5、Set 7, Classic 5、Set 14、Live 1、Kodak、General 100、CLIC 2019という、低解像度から高解像度のさまざまなデータセットに基づいて評価される。
JPEG,JPEG2000,BPG,および最近のCNNの手法と比較して,提案アルゴリズムはPSNRの20.75%,8.47%,3.22%,3.23%,24.59%,14.46%,10.14%,8.57%をそれぞれ低ビットレートで改善した。
同様に、MS-SSIMのこの改善はおよそ71.43%、50%、36.36%、23.08%、64.70%、64.47%、61.29%、47.06%、51.52%、16.28%である。
CLIC 2019データセットでは、PSNRは約16.67%、10.53%、6.78%、24.62%、17.39%、14.08%の低ビットレートで、JPEG2000、BPG、最近のCNNアプローチよりも優れている。
同様に、MS-SSIMは約72%、45.45%、39.13%、18.52%、71.43%、50%、41.18%、17.07%の低ビットレートである。
同様の改善は、他のデータセットでも実現されている。
関連論文リスト
- Sebica: Lightweight Spatial and Efficient Bidirectional Channel Attention Super Resolution Network [0.0]
SISR(Single Image Super-Resolution)は,低解像度画像の画質向上のための重要な技術である。
本稿では,空間的および効率的な双方向チャネルアテンション機構を組み込んだ軽量ネットワークSebicaを提案する。
セビカは高い復元品質を維持しながら計算コストを大幅に削減する。
論文 参考訳(メタデータ) (2024-10-27T18:27:07Z) - Application of Quantum Pre-Processing Filter for Binary Image
Classification with Small Samples [1.2965700352825555]
提案する量子前処理フィルタ(QPF)のバイナリ画像分類への応用について検討した。
MNIST(手書き桁)、EMNIST(手書き桁とアルファベット)、CIFAR-10(写真画像)、GTSRB(実生活交通標識画像)の4つのデータセットでQPFを評価した。
論文 参考訳(メタデータ) (2023-08-28T23:08:32Z) - Patch-Level Contrasting without Patch Correspondence for Accurate and
Dense Contrastive Representation Learning [79.43940012723539]
ADCLRは、正確で高密度な視覚表現を学習するための自己教師型学習フレームワークである。
提案手法は, コントラッシブな手法のための新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2023-06-23T07:38:09Z) - Pruning by Active Attention Manipulation [49.61707925611295]
CNNのフィルタプルーニングは典型的には、CNNのフィルタ重みやアクティベーションマップに離散マスクを適用することで達成される。
ここでは、アクティブアテンション操作(PAAM)によるプルーニング(pruning)という新しいフィルタ強調表示概念を提案する。
PAAMはフィルタ重みからアナログフィルタスコアを学習し、そのスコアの加算項によって正規化されたコスト関数を最適化する。
論文 参考訳(メタデータ) (2022-10-20T09:17:02Z) - Simple Baselines for Image Restoration [79.48718779396971]
本稿では,SOTA(State-of-the-art)法を超越した,計算効率の高い単純なベースラインを提案する。
我々は、ベースラインからActivation Free Network、すなわちNAFNetを導出する。
SOTAの結果は、GoProの33.69dB PSNR(画像劣化)、計算コストのわずか8.4%のSOTA 0.38dB、SIDDの40.30dB PSNR(画像劣化)、計算コストの半分未満のSOTA 0.28dBといった、様々な挑戦的なベンチマークで達成されている。
論文 参考訳(メタデータ) (2022-04-10T12:48:38Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - Learning True Rate-Distortion-Optimization for End-To-End Image
Compression [59.816251613869376]
速度歪みの最適化は、従来の画像圧縮とビデオ圧縮の重要な部分である。
本稿では,RDO結果の低複雑さ推定をトレーニングに導入することにより,トレーニングの強化を図る。
我々は以前のRDONetモデルに比べてMS-SSIMで平均19.6%のレートセーブを実現し、従来のディープイメージコーダに比べて27.3%のレートセーブを実現した。
論文 参考訳(メタデータ) (2022-01-05T13:02:00Z) - Problem-dependent attention and effort in neural networks with
applications to image resolution and model selection [0.0]
本稿では,画像分類におけるデータと計算コストを削減するために,アンサンブルに基づく2つの新しい手法を提案する。
任意の分類器で使用することができ、追加のトレーニングを必要としない。
論文 参考訳(メタデータ) (2022-01-05T02:27:35Z) - TACTIC: Joint Rate-Distortion-Accuracy Optimisation for Low Bitrate
Compression [28.88113725832339]
TACTIC: インテリジェントコーディングによるタスク認識圧縮。
我々の損失圧縮モデルは、特定のタスクに対するレート歪み精度トレードオフに基づいて学習する。
我々はImageNetサブセット分類の精度を4.5%向上させることができる。
論文 参考訳(メタデータ) (2021-09-22T11:27:57Z) - Non-Parametric Adaptive Network Pruning [125.4414216272874]
アルゴリズム設計を簡略化するノンパラメトリックモデリングを導入。
顔認識コミュニティに触発されて,メッセージパッシングアルゴリズムを用いて,適応的な例示数を求める。
EPrunerは「重要」フィルタを決定する際にトレーニングデータへの依存を壊します。
論文 参考訳(メタデータ) (2021-01-20T06:18:38Z) - Improved Image Coding Autoencoder With Deep Learning [8.92071749364712]
自動エンコーダベースのパイプラインを構築し,Ball'eのアプローチに基づく極端エンドツーエンドの画像圧縮を実現する。
ピクセル当たりのビット数は4.0%減少し(bpp)、マルチスケール構造類似度(MS-SSIM)は0.03%増加し、ピーク信号-ノイズ比(PSNR)は0.47%低下した。
論文 参考訳(メタデータ) (2020-02-28T03:21:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。