論文の概要: Subjective evaluation of traditional and learning-based image coding
methods
- arxiv url: http://arxiv.org/abs/2107.13122v1
- Date: Wed, 28 Jul 2021 01:37:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-29 13:53:43.146832
- Title: Subjective evaluation of traditional and learning-based image coding
methods
- Title(参考訳): 伝統と学習に基づく画像符号化手法の主観評価
- Authors: Zhigao Fang and Jiaqi Zhang and Lu Yu and Yin Zhao
- Abstract要約: 最先端の伝統的な符号化手法であるHEVCとVVCが代表的伝統的手法として使用されている。
使用する学習法はCNNベースの手法だけでなく、GANベースの手法も含んでいる。
実験により、CNNベースの手法とGANベースの手法は、ビットレートが低い従来の手法よりも性能が良いことを示した。
- 参考スコア(独自算出の注目度): 8.896401351144966
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We conduct a subjective experiment to compare the performance of traditional
image coding methods and learning-based image coding methods. HEVC and VVC, the
state-of-the-art traditional coding methods, are used as the representative
traditional methods. The learning-based methods used contain not only CNN-based
methods, but also a GAN-based method, all of which are advanced or typical.
Single Stimuli (SS), which is also called Absolute Category Rating (ACR), is
adopted as the methodology of the experiment to obtain perceptual quality of
images. Additionally, we utilize some typical and frequently used objective
quality metrics to evaluate the coding methods in the experiment as comparison.
The experiment shows that CNN-based and GAN-based methods can perform better
than traditional methods in low bit-rates. In high bit-rates, however, it is
hard to verify whether CNN-based methods are superior to traditional methods.
Because the GAN method does not provide models with high target bit-rates, we
cannot exactly tell the performance of the GAN method in high bit-rates.
Furthermore, some popular objective quality metrics have not shown the ability
well to measure quality of images generated by learning-based coding methods,
especially the GAN-based one.
- Abstract(参考訳): 従来の画像符号化手法と学習に基づく画像符号化手法の性能を比較するための主観的な実験を行う。
最先端の伝統的な符号化手法であるHEVCとVVCが代表的伝統的手法として使用されている。
使用する学習法はCNNベースの手法だけでなく、GANベースの手法も含んでいる。
ACR(Absolute Category Rating)とも呼ばれるSingle Stimuli(SS)は、画像の知覚品質を得るために実験の方法論として採用されている。
さらに,実験における符号化手法を比較評価するために,典型的かつ頻繁な客観的品質指標を利用する。
実験により、cnnベースおよびganベースの手法は、低ビットレートでの従来の手法よりも優れた性能を示す。
しかし、高ビットレートでは、cnnベースのメソッドが従来の方法より優れているかどうかを検証するのは難しい。
GAN法は高目標ビットレートのモデルを提供していないため、GAN法の性能を高いビットレートで正確に知ることはできない。
さらに、いくつかの一般的な客観的品質指標は、学習ベースの符号化手法、特にGANベースの手法によって生成された画像の品質を測定する能力を示していない。
関連論文リスト
- A comparative study of generative adversarial networks for image recognition algorithms based on deep learning and traditional methods [34.1086022278394]
本研究の目的は,画像認識分野におけるディープラーニング技術,特にGANのメリットと応用可能性を評価することである。
画像生成と認識におけるGANの動作原理,ネットワーク構造,およびユニークな利点を紹介する。
実験の結果,GANは従来の手法と比較して,複雑な画像の処理,認識精度,アンチノイズ能力に優れていた。
論文 参考訳(メタデータ) (2024-08-07T06:11:25Z) - Classification Metrics for Image Explanations: Towards Building Reliable XAI-Evaluations [0.24578723416255752]
解像度法は、入力画像に対して(超)画素単位の特徴属性スコアを提供する。
新たな評価指標を開発し,イメージネット上で一般的な評価手法をベンチマークした。
心理測定テストの概念に基づく,そのような指標の信頼性評価手法を提案する。
論文 参考訳(メタデータ) (2024-06-07T16:37:50Z) - Refining Coded Image in Human Vision Layer Using CNN-Based Post-Processing [0.0]
本稿では,ポストプロセッシングをスケーラブルな符号化方式に統合することにより,人間のデコード画像の品質を向上させる手法を提案する。
実験結果から, 後処理により圧縮性能が向上することが示された。
提案手法の有効性を従来の手法との比較により検証した。
論文 参考訳(メタデータ) (2024-05-20T09:19:01Z) - Towards Diverse Evaluation of Class Incremental Learning: A Representation Learning Perspective [67.45111837188685]
クラスインクリメンタル学習(CIL)アルゴリズムは、インクリメンタルに到着したデータから新しいオブジェクトクラスを継続的に学習することを目的としている。
表現学習における様々な評価プロトコルを用いて,CILアルゴリズムによって訓練されたニューラルネットワークモデルを実験的に解析する。
論文 参考訳(メタデータ) (2022-06-16T11:44:11Z) - Effect of Parameter Optimization on Classical and Learning-based Image
Matching Methods [10.014010310188821]
相互近接探索と比例検定を併用して古典的手法と学習的手法を比較し,比例検定閾値を最適化する。
公正な比較の後、HPatchesデータセットの実験結果から、古典的手法と学習的手法のパフォーマンスギャップはそれほど大きくないことが明らかとなった。
最近のアプローチであるDFMは、訓練済みのVGG機能のみを記述子と比率テストとして用いており、よく訓練された学習ベースの手法よりも優れている。
論文 参考訳(メタデータ) (2021-08-18T14:45:32Z) - Objective video quality metrics application to video codecs comparisons:
choosing the best for subjective quality estimation [101.18253437732933]
品質評価は、ビデオ圧縮アルゴリズムの作成と比較において重要な役割を果たす。
比較のために、異なる標準のビデオコーデックでエンコードされた一連のビデオを使用し、2018年から2021年までの一連のストリームに対して、視覚的品質スコアを収集しました。
論文 参考訳(メタデータ) (2021-07-21T17:18:11Z) - Evaluation of Saliency-based Explainability Method [2.733700237741334]
説明可能なAI(XAI)メソッドのクラスは、CNNモデルがその動作を説明する方法としてイメージを分類するために、画像の一部を強調するために、唾液マップを提供する。
これらの手法はユーザがCNNの予測を理解するための直感的な方法を提供する。
定量的な計算テスト以外に、これらの手法が有用であることを示す証拠の大部分は逸話である。
論文 参考訳(メタデータ) (2021-06-24T05:40:50Z) - Visualization of Supervised and Self-Supervised Neural Networks via
Attribution Guided Factorization [87.96102461221415]
クラスごとの説明性を提供するアルゴリズムを開発した。
実験の広範なバッテリーでは、クラス固有の可視化のための手法の能力を実証する。
論文 参考訳(メタデータ) (2020-12-03T18:48:39Z) - There and Back Again: Revisiting Backpropagation Saliency Methods [87.40330595283969]
正当性法は,各入力サンプルの重要度マップを作成することによって,モデルの予測を説明する。
このような手法の一般的なクラスは、信号のバックプロパゲートと結果の勾配の分析に基づいている。
本稿では,そのような手法を統一可能な単一のフレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-06T17:58:08Z) - Learning to Select Base Classes for Few-shot Classification [96.92372639495551]
我々は、数ショットモデルの一般化性能を示す指標として、類似度比を用いる。
次に、類似度比に対する部分モジュラー最適化問題として基底クラス選択問題を定式化する。
論文 参考訳(メタデータ) (2020-04-01T09:55:18Z) - Interpolation Technique to Speed Up Gradients Propagation in Neural ODEs [71.26657499537366]
本稿では,ニューラルネットワークモデルにおける勾配の効率的な近似法を提案する。
我々は、分類、密度推定、推論近似タスクにおいて、ニューラルODEをトレーニングするリバースダイナミック手法と比較する。
論文 参考訳(メタデータ) (2020-03-11T13:15:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。