論文の概要: An Unsupervised Information-Theoretic Perceptual Quality Metric
- arxiv url: http://arxiv.org/abs/2006.06752v3
- Date: Sun, 10 Jan 2021 19:28:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 14:06:17.853557
- Title: An Unsupervised Information-Theoretic Perceptual Quality Metric
- Title(参考訳): 教師なし情報理論の知覚品質指標
- Authors: Sangnie Bhardwaj, Ian Fischer, Johannes Ball\'e, Troy Chinen
- Abstract要約: 我々は,最近のBAPPS画像品質評価データセットにおいて,PIMは教師付きメトリクスと競合することを示す。
また、ImageNet-Cデータセットを用いて定性的な実験を行い、アーキテクチャの詳細に関してPIMが堅牢であることを示す。
- 参考スコア(独自算出の注目度): 7.887535787216618
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tractable models of human perception have proved to be challenging to build.
Hand-designed models such as MS-SSIM remain popular predictors of human image
quality judgements due to their simplicity and speed. Recent modern deep
learning approaches can perform better, but they rely on supervised data which
can be costly to gather: large sets of class labels such as ImageNet, image
quality ratings, or both. We combine recent advances in information-theoretic
objective functions with a computational architecture informed by the
physiology of the human visual system and unsupervised training on pairs of
video frames, yielding our Perceptual Information Metric (PIM). We show that
PIM is competitive with supervised metrics on the recent and challenging BAPPS
image quality assessment dataset and outperforms them in predicting the ranking
of image compression methods in CLIC 2020. We also perform qualitative
experiments using the ImageNet-C dataset, and establish that PIM is robust with
respect to architectural details.
- Abstract(参考訳): 人間の知覚のトラクタブルモデルの構築は困難であることが判明した。
MS-SSIMのような手動設計のモデルは、その単純さと速度のために人間の画像品質判断の一般的な予測器のままである。
最近のディープラーニングアプローチでは、パフォーマンスが向上するが、イメージネットのような大規模なクラスラベルや画質評価など、収集にコストがかかる教師付きデータに依存している。
我々は,情報理論の目的関数の最近の進歩と,人間の視覚システムの生理学から情報を得た計算アーキテクチャと,ビデオフレームのペアによる教師なしトレーニングを組み合わせることで,知覚情報メトリクス(PIM)を得られる。
PIMは,近年のBAPPS画像品質評価データセットの教師付き指標と競合し,CLIC 2020における画像圧縮手法のランク付けに優れることを示す。
また、ImageNet-Cデータセットを用いて定性的実験を行い、アーキテクチャの詳細に関してPIMが堅牢であることを示す。
関連論文リスト
- Sliced Maximal Information Coefficient: A Training-Free Approach for Image Quality Assessment Enhancement [12.628718661568048]
我々は,人間の品質評価の過程を模倣する,一般化された視覚的注意度推定戦略を検討することを目的とする。
特に、劣化画像と参照画像の統計的依存性を測定することによって、人間の注意生成をモデル化する。
既存のIQAモデルのアテンションモジュールを組み込んだ場合、既存のIQAモデルの性能を一貫して改善できることを示す実験結果が得られた。
論文 参考訳(メタデータ) (2024-08-19T11:55:32Z) - Q-Ground: Image Quality Grounding with Large Multi-modality Models [61.72022069880346]
Q-Groundは、大規模な視覚的品質グラウンドに取り組むための最初のフレームワークである。
Q-Groundは、大規模なマルチモダリティモデルと詳細な視覚的品質分析を組み合わせる。
コントリビューションの中心は、QGround-100Kデータセットの導入です。
論文 参考訳(メタデータ) (2024-07-24T06:42:46Z) - Opinion-Unaware Blind Image Quality Assessment using Multi-Scale Deep Feature Statistics [54.08757792080732]
我々は,事前学習された視覚モデルからの深い特徴を統計的解析モデルと統合して,意見認識のないBIQA(OU-BIQA)を実現することを提案する。
提案モデルは,最先端のBIQAモデルと比較して,人間の視覚的知覚との整合性に優れる。
論文 参考訳(メタデータ) (2024-05-29T06:09:34Z) - Multi-Modal Prompt Learning on Blind Image Quality Assessment [65.0676908930946]
画像品質評価(IQA)モデルは意味情報から大きな恩恵を受け、異なる種類のオブジェクトを明瞭に扱うことができる。
十分な注釈付きデータが不足している従来の手法では、セマンティックな認識を得るために、CLIPイメージテキスト事前学習モデルをバックボーンとして使用していた。
近年のアプローチでは、このミスマッチに即時技術を使って対処する試みがあるが、これらの解決策には欠点がある。
本稿では、IQAのための革新的なマルチモーダルプロンプトベースの手法を提案する。
論文 参考訳(メタデータ) (2024-04-23T11:45:32Z) - QUASAR: QUality and Aesthetics Scoring with Advanced Representations [20.194917729936357]
本稿では,画像品質と美学評価のための新しいデータ駆動非パラメトリック手法を提案する。
データに効率的な画像アンカーを提案することで、表現力のあるテキスト埋め込みの必要性を解消する。
論文 参考訳(メタデータ) (2024-03-11T16:21:50Z) - Exploring CLIP for Assessing the Look and Feel of Images [87.97623543523858]
ゼロショット方式で画像の品質知覚(ルック)と抽象知覚(フィール)の両方を評価するために,コントラスト言語-画像事前学習(CLIP)モデルを導入する。
以上の結果から,CLIPは知覚的評価によく適合する有意義な先行情報を捉えることが示唆された。
論文 参考訳(メタデータ) (2022-07-25T17:58:16Z) - Conformer and Blind Noisy Students for Improved Image Quality Assessment [80.57006406834466]
知覚品質評価(IQA)のための学習ベースアプローチは、通常、知覚品質を正確に測定するために歪んだ画像と参照画像の両方を必要とする。
本研究では,変換器を用いた全参照IQAモデルの性能について検討する。
また,全教師モデルから盲人学生モデルへの半教師付き知識蒸留に基づくIQAの手法を提案する。
論文 参考訳(メタデータ) (2022-04-27T10:21:08Z) - Continual Learning for Blind Image Quality Assessment [80.55119990128419]
ブラインド画像品質評価(BIQA)モデルは、サブポピュレーションシフトに継続的に適応できない。
最近の研究では、利用可能なすべての人間評価のIQAデータセットの組み合わせに関するBIQAメソッドのトレーニングが推奨されている。
モデルがIQAデータセットのストリームから継続的に学習するBIQAの継続的学習を策定する。
論文 参考訳(メタデータ) (2021-02-19T03:07:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。