論文の概要: Subjective Visual Quality Assessment for High-Fidelity Learning-Based Image Compression
- arxiv url: http://arxiv.org/abs/2504.06301v2
- Date: Thu, 10 Apr 2025 11:37:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-11 12:24:58.166430
- Title: Subjective Visual Quality Assessment for High-Fidelity Learning-Based Image Compression
- Title(参考訳): 高忠実度学習に基づく画像圧縮のための主観的視覚品質評価
- Authors: Mohsen Jenadeleh, Jon Sneyers, Panqi Jia, Shima Mohammadi, Joao Ascenso, Dietmar Saupe,
- Abstract要約: JPEG AIC-3 手法を用いて,JPEG AI 圧縮画像の包括的主観的品質評価を行う。
強化された3重項比較と平易な3重項比較に基づく統一モデルを用いて,JNDに基づく品質尺度を再構築した。
CVVDPの指標は全体の最高性能を達成したが、CVDPを含むほとんどの指標はJPEG AI圧縮画像の品質予測において過度に楽観的であった。
- 参考スコア(独自算出の注目度): 2.296138318128071
- License:
- Abstract: Learning-based image compression methods have recently emerged as promising alternatives to traditional codecs, offering improved rate-distortion performance and perceptual quality. JPEG AI represents the latest standardized framework in this domain, leveraging deep neural networks for high-fidelity image reconstruction. In this study, we present a comprehensive subjective visual quality assessment of JPEG AI-compressed images using the JPEG AIC-3 methodology, which quantifies perceptual differences in terms of Just Noticeable Difference (JND) units. We generated a dataset of 50 compressed images with fine-grained distortion levels from five diverse sources. A large-scale crowdsourced experiment collected 96,200 triplet responses from 459 participants. We reconstructed JND-based quality scales using a unified model based on boosted and plain triplet comparisons. Additionally, we evaluated the alignment of multiple objective image quality metrics with human perception in the high-fidelity range. The CVVDP metric achieved the overall highest performance; however, most metrics including CVVDP were overly optimistic in predicting the quality of JPEG AI-compressed images. These findings emphasize the necessity for rigorous subjective evaluations in the development and benchmarking of modern image codecs, particularly in the high-fidelity range. Another technical contribution is the introduction of the well-known Meng-Rosenthal-Rubin statistical test to the field of Quality of Experience research. This test can reliably assess the significance of difference in performance of quality metrics in terms of correlation between metrics and ground truth. The complete dataset, including all subjective scores, is publicly available at https://github.com/jpeg-aic/dataset-JPEG-AI-SDR25.
- Abstract(参考訳): 近年,学習に基づく画像圧縮手法が従来のコーデックに代わる有望な代替手段として登場し,速度歪み性能と知覚品質が向上した。
JPEG AIは、この領域で最新の標準化されたフレームワークであり、高忠実度画像再構成にディープニューラルネットワークを活用する。
本研究では、JPEG AIC-3法を用いて、JPEGAI圧縮画像の総合的な主観的視覚的品質評価を行い、ジャスト・インテンショナブル・ディファレンス(JND)単位の知覚的差異を定量化する。
5つのソースから微細な歪みレベルを持つ50個の圧縮画像のデータセットを生成した。
大規模なクラウドソース実験では,459人の参加者から96,200人の3重項の回答が得られた。
強化された3重項比較と平易な3重項比較に基づく統一モデルを用いて,JNDに基づく品質尺度を再構築した。
さらに,多目的画像品質指標と高忠実度領域における人間の知覚のアライメントを評価した。
CVVDP測定は全体の最高性能を達成したが、CVVDPを含むほとんどの指標はJPEG AI圧縮画像の品質予測において過度に楽観的であった。
これらの知見は,現代画像コーデックの開発,ベンチマーク,特に高忠実度領域における厳密な主観評価の必要性を強調した。
もう一つの技術的貢献は、よく知られたMeng-Rosenthal-Rubin統計テストがQuality of Experience研究分野に導入されたことである。
このテストは、測定値と基礎的真理の相関から、品質指標のパフォーマンスの違いの意義を確実に評価することができる。
すべての主観的なスコアを含む完全なデータセットは、https://github.com/jpeg-aic/dataset-JPEG-AI-SDR25で公開されている。
関連論文リスト
- Fine-grained subjective visual quality assessment for high-fidelity compressed images [4.787528476079247]
JPEG標準化プロジェクトであるAICは、高忠実度画像に対する主観的な画質評価手法を開発している。
本稿では,提案手法,高品質な圧縮画像のデータセット,およびそれに対応するクラウドソースによる視覚的品質評価について述べる。
また、単に目立った差分(JND)単位で品質スケールの値を再構築するデータ分析のアプローチも概説している。
論文 参考訳(メタデータ) (2024-10-12T11:37:19Z) - Q-Ground: Image Quality Grounding with Large Multi-modality Models [61.72022069880346]
Q-Groundは、大規模な視覚的品質グラウンドに取り組むための最初のフレームワークである。
Q-Groundは、大規模なマルチモダリティモデルと詳細な視覚的品質分析を組み合わせる。
コントリビューションの中心は、QGround-100Kデータセットの導入です。
論文 参考訳(メタデータ) (2024-07-24T06:42:46Z) - Dual-Branch Network for Portrait Image Quality Assessment [76.27716058987251]
ポートレート画像品質評価のためのデュアルブランチネットワーク(PIQA)を提案する。
我々は2つのバックボーンネットワーク(textiti.e., Swin Transformer-B)を使用して、肖像画全体と顔画像から高品質な特徴を抽出する。
我々は、画像シーンの分類と品質評価モデルであるLIQEを利用して、品質認識とシーン固有の特徴を補助的特徴として捉えている。
論文 参考訳(メタデータ) (2024-05-14T12:43:43Z) - Pairwise Comparisons Are All You Need [22.798716660911833]
ブラインド画像品質評価(BIQA)アプローチは、様々な画像に一様に適用される一般的な品質基準に依存しているため、現実のシナリオでは不足することが多い。
本稿では、従来のBIQAの制限を回避すべく設計されたペアワイズ比較フレームワークであるPICNIQを紹介する。
PICNIQは、サイコメトリックスケーリングアルゴリズムを用いることで、対比較をジャストオブジェクタブルディファレンス(JOD)の品質スコアに変換し、画像品質の粒度と解釈可能な指標を提供する。
論文 参考訳(メタデータ) (2024-03-13T23:43:36Z) - Compressed image quality assessment using stacking [4.971244477217376]
圧縮画像品質評価において、一般化は大きな課題であると見なすことができる。
表示されたIQAには、セマンティック情報と低レベル情報の両方が使われ、人間の視覚システムを予測する。
clic2024の知覚画像チャレンジの品質ベンチマークの精度は79.6%に達した。
論文 参考訳(メタデータ) (2024-02-01T20:12:26Z) - PIQI: Perceptual Image Quality Index based on Ensemble of Gaussian
Process Regression [2.9412539021452715]
デジタル画像の品質を評価するためにPIQI(Perceptual Image Quality Index)を提案する。
PIQIの性能は6つのベンチマークデータベースでチェックされ、12の最先端の手法と比較される。
論文 参考訳(メタデータ) (2023-05-16T06:44:17Z) - High-Perceptual Quality JPEG Decoding via Posterior Sampling [13.238373528922194]
JPEGアーチファクト修正のための異なるパラダイムを提案する。
我々は、圧縮された入力と整合しながら、シャープで詳細で視覚的に再構成された画像を得ることを目指している。
我々のソリューションは、完全な整合性のある入力に対して、多種多様な可塑性かつ高速な再構成を提供する。
論文 参考訳(メタデータ) (2022-11-21T19:47:59Z) - Conformer and Blind Noisy Students for Improved Image Quality Assessment [80.57006406834466]
知覚品質評価(IQA)のための学習ベースアプローチは、通常、知覚品質を正確に測定するために歪んだ画像と参照画像の両方を必要とする。
本研究では,変換器を用いた全参照IQAモデルの性能について検討する。
また,全教師モデルから盲人学生モデルへの半教師付き知識蒸留に基づくIQAの手法を提案する。
論文 参考訳(メタデータ) (2022-04-27T10:21:08Z) - Confusing Image Quality Assessment: Towards Better Augmented Reality
Experience [96.29124666702566]
我々はAR技術を仮想シーンと実シーンの重ね合わせとみなし、視覚的混乱を基本的な理論として紹介する。
ConFusing Image Quality Assessment (CFIQA)データベースが構築され、600個の参照画像と300個の歪画像とをペアに混合して生成する。
また、難解な画像品質をよりよく評価するために、CFIQAと呼ばれる客観的な計量も提案されている。
論文 参考訳(メタデータ) (2022-04-11T07:03:06Z) - Image Quality Assessment using Contrastive Learning [50.265638572116984]
我々は、補助的な問題を解決するために、対照的な対の目的を用いて深層畳み込みニューラルネットワーク(CNN)を訓練する。
本研究では,最新のNR画像品質モデルと比較して,ContriQUEが競争性能を向上することを示す。
以上の結果から,大きなラベル付き主観的画像品質データセットを必要とせずに,知覚的関連性を持つ強力な品質表現が得られることが示唆された。
論文 参考訳(メタデータ) (2021-10-25T21:01:00Z) - Towards Flexible Blind JPEG Artifacts Removal [73.46374658847675]
人工物除去と細部保存のトレードオフを制御するために,適応可能な品質因子を予測できるフレキシブルブラインド畳み込みニューラルネットワーク,すなわちFBCNNを提案する。
提案するFBCNNは,定量的な計測値と視覚的品質の両方の観点から,最先端の手法に対して良好な性能を実現する。
論文 参考訳(メタデータ) (2021-09-29T17:12:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。