論文の概要: JPEG AI Image Compression Visual Artifacts: Detection Methods and Dataset
- arxiv url: http://arxiv.org/abs/2411.06810v1
- Date: Mon, 11 Nov 2024 09:11:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-12 14:10:57.091410
- Title: JPEG AI Image Compression Visual Artifacts: Detection Methods and Dataset
- Title(参考訳): JPEG AI画像圧縮ビジュアルアーティファクト:検出方法とデータセット
- Authors: Daria Tsereh, Mark Mirgaleev, Ivan Molodetskikh, Roman Kazantsev, Dmitriy Vatolin,
- Abstract要約: 近年,学習に基づく画像圧縮手法が改良され,従来のコーデックよりも優れ始めた。
ニューラルネットワークアプローチは、いくつかの画像に予期せず視覚的アーティファクトを導入することができる。
本研究では, 3種類のアーティファクトを別々に検出し, 影響を受ける領域を局所化し, アーティファクトの強度を定量化する手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Learning-based image compression methods have improved in recent years and started to outperform traditional codecs. However, neural-network approaches can unexpectedly introduce visual artifacts in some images. We therefore propose methods to separately detect three types of artifacts (texture and boundary degradation, color change, and text corruption), to localize the affected regions, and to quantify the artifact strength. We consider only those regions that exhibit distortion due solely to the neural compression but that a traditional codec recovers successfully at a comparable bitrate. We employed our methods to collect artifacts for the JPEG AI verification model with respect to HM-18.0, the H.265 reference software. We processed about 350,000 unique images from the Open Images dataset using different compression-quality parameters; the result is a dataset of 46,440 artifacts validated through crowd-sourced subjective assessment. Our proposed dataset and methods are valuable for testing neural-network-based image codecs, identifying bugs in these codecs, and enhancing their performance. We make source code of the methods and the dataset publicly available.
- Abstract(参考訳): 近年,学習に基づく画像圧縮手法が改良され,従来のコーデックよりも優れ始めた。
しかし、ニューラルネットワークアプローチは、いくつかの画像に予期せず視覚的アーティファクトを導入することができる。
そこで本稿では, 3種類のアーティファクト(テクスチャと境界劣化, 色変化, テキスト劣化)を別々に検出し, 影響領域を局所化し, アーティファクト強度を定量化する手法を提案する。
ニューラル圧縮のみによる歪みを示す領域のみを考えるが、従来のコーデックは同等のビットレートで回復する。
H.265参照ソフトウェアであるHM-18.0に関して,JPEGAI検証モデルのアーティファクト収集に本手法を用いた。
我々は、圧縮品質の異なるパラメータを用いて、Open Imagesデータセットから約35万のユニークな画像を処理し、その結果、クラウドソースによる主観評価によって検証された46,440個のアーティファクトのデータセットである。
提案するデータセットと手法は,ニューラルネットワークベースの画像コーデックのテスト,これらのコーデックのバグの特定,性能の向上に有用である。
メソッドとデータセットのソースコードを公開しています。
関連論文リスト
- Recompression Based JPEG Tamper Detection and Localization Using Deep Neural Network Eliminating Compression Factor Dependency [2.8498944632323755]
本稿では,JPEG画像におけるrepression based forgeryの存在を検出することができる畳み込みニューラルネットワークに基づくディープラーニングアーキテクチャを提案する。
本研究では,リ圧縮機能に基づく画像操作領域のローカライズも目的とする。
論文 参考訳(メタデータ) (2024-07-03T09:19:35Z) - Semantic Ensemble Loss and Latent Refinement for High-Fidelity Neural Image Compression [58.618625678054826]
本研究は、最適な視覚的忠実度のために設計された強化されたニューラル圧縮手法を提案する。
我々は,洗練されたセマンティック・アンサンブル・ロス,シャルボニエ・ロス,知覚的損失,スタイル・ロス,非バイナリ・ディバイザ・ロスを組み込んだモデルを構築した。
実験により,本手法は神経画像圧縮の統計的忠実度を著しく向上させることが示された。
論文 参考訳(メタデータ) (2024-01-25T08:11:27Z) - Multi-Modality Deep Network for JPEG Artifacts Reduction [33.02405073842042]
テキスト誘導JPEGアーティファクト削減のためのマルチモーダル融合学習法を提案する。
提案手法は,最先端の手法と比較して,より優れたデブロッキング結果が得られる。
論文 参考訳(メタデータ) (2023-05-04T11:54:02Z) - Estimating the Resize Parameter in End-to-end Learned Image Compression [50.20567320015102]
本稿では,最近の画像圧縮モデルの速度歪みトレードオフをさらに改善する検索自由化フレームワークについて述べる。
提案手法により,Bjontegaard-Deltaレート(BD-rate)を最大10%向上させることができる。
論文 参考訳(メタデータ) (2022-04-26T01:35:02Z) - The Devil Is in the Details: Window-based Attention for Image
Compression [58.1577742463617]
既存の学習画像圧縮モデルは畳み込みニューラルネットワーク(CNN)に基づいている。
本稿では,複数種類の注意機構が局所特徴学習に与える影響について検討し,より単純で効果的なウィンドウベースの局所的注意ブロックを提案する。
提案されたウィンドウベースのアテンションは非常に柔軟で、CNNとTransformerモデルを強化するためのプラグイン・アンド・プレイコンポーネントとして機能する可能性がある。
論文 参考訳(メタデータ) (2022-03-16T07:55:49Z) - Learning JPEG Compression Artifacts for Image Manipulation Detection and
Localization [26.36646590957593]
画像中の内在統計を解析することにより、真正領域と改ざん領域を区別することが不可欠である。
本稿では、圧縮アーティファクトが残る離散コサイン変換(DCT)係数を用いた畳み込みニューラルネットワーク(CNN)による画像操作のローカライズを提案する。
DCT係数の分布を学習するニューラルネットワークの設計と訓練方法を示す。
これは、改ざんされた領域を検出してローカライズする、従来のニューラルネットワークとディープニューラルネットワークベースの手法を著しく上回っている。
論文 参考訳(メタデータ) (2021-08-30T01:21:07Z) - Analyzing and Mitigating JPEG Compression Defects in Deep Learning [69.04777875711646]
本稿では,JPEG圧縮が共通タスクやデータセットに与える影響を統一的に検討する。
高圧縮の一般的なパフォーマンス指標には大きなペナルティがあることが示される。
論文 参考訳(メタデータ) (2020-11-17T20:32:57Z) - Learning a Single Model with a Wide Range of Quality Factors for JPEG
Image Artifacts Removal [24.25688335628976]
ロスシー圧縮は、圧縮された画像にアーティファクトをもたらし、視覚的品質を低下させる。
本稿では,高度に堅牢な圧縮アーティファクト除去ネットワークを提案する。
提案するネットワークは,幅広い品質要因を扱うためにトレーニング可能な単一モデルアプローチである。
論文 参考訳(メタデータ) (2020-09-15T08:16:58Z) - Quantization Guided JPEG Artifact Correction [69.04777875711646]
我々はJPEGファイル量子化行列を用いたアーティファクト修正のための新しいアーキテクチャを開発した。
これにより、特定の品質設定のためにトレーニングされたモデルに対して、単一のモデルで最先端のパフォーマンスを達成できます。
論文 参考訳(メタデータ) (2020-04-17T00:10:08Z) - Discernible Image Compression [124.08063151879173]
本稿では、外観と知覚の整合性の両方を追求し、圧縮画像を作成することを目的とする。
エンコーダ・デコーダ・フレームワークに基づいて,事前学習したCNNを用いて,オリジナル画像と圧縮画像の特徴を抽出する。
ベンチマーク実験により,提案手法を用いて圧縮した画像は,その後の視覚認識・検出モデルでもよく認識できることが示された。
論文 参考訳(メタデータ) (2020-02-17T07:35:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。