論文の概要: KonX: Cross-Resolution Image Quality Assessment
- arxiv url: http://arxiv.org/abs/2212.05813v1
- Date: Mon, 12 Dec 2022 10:23:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-13 17:58:11.910905
- Title: KonX: Cross-Resolution Image Quality Assessment
- Title(参考訳): KonX: クロスリゾリューション画像の品質評価
- Authors: Oliver Wiedemann and Vlad Hosu and Shaolin Su and Dietmar Saupe
- Abstract要約: 本研究は,この2つの問題を,KonXを介して別々に検討した最初の研究である。
対象のIQA法はスケールバイアスを有しており,予測性能が低下することを示す。
本稿では,従来のIQAモデルよりも高性能なマルチスケール・マルチカラムアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 6.658103076536836
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scale-invariance is an open problem in many computer vision subfields. For
example, object labels should remain constant across scales, yet model
predictions diverge in many cases. This problem gets harder for tasks where the
ground-truth labels change with the presentation scale. In image quality
assessment (IQA), downsampling attenuates impairments, e.g., blurs or
compression artifacts, which can positively affect the impression evoked in
subjective studies. To accurately predict perceptual image quality,
cross-resolution IQA methods must therefore account for resolution-dependent
errors induced by model inadequacies as well as for the perceptual label shifts
in the ground truth. We present the first study of its kind that disentangles
and examines the two issues separately via KonX, a novel, carefully crafted
cross-resolution IQA database. This paper contributes the following: 1. Through
KonX, we provide empirical evidence of label shifts caused by changes in the
presentation resolution. 2. We show that objective IQA methods have a scale
bias, which reduces their predictive performance. 3. We propose a multi-scale
and multi-column DNN architecture that improves performance over previous
state-of-the-art IQA models for this task, including recent transformers. We
thus both raise and address a novel research problem in image quality
assessment.
- Abstract(参考訳): スケール不変性は多くのコンピュータビジョンサブフィールドにおいてオープンな問題である。
例えば、オブジェクトラベルはスケールにわたって一定であり続けるべきですが、モデル予測は多くのケースでばらつきます。
この問題は、プレゼンテーションの規模で基調ラベルが変化するタスクでは難しくなる。
画質アセスメント(iqa)では、ダウンサンプリングはぼやけや圧縮アーティファクトなどの障害を弱め、主観的な研究で誘発される印象に正の影響を与える。
したがって、知覚画像の品質を正確に予測するためには、クロスレゾリューションIQA法はモデル不整合によって引き起こされる分解能依存誤差と、基底真実における知覚ラベルシフトを考慮しなければならない。
本報告では,この2つの問題を分離して検討する手法として,新しいクロスレゾリューションIQAデータベースであるKonXについて述べる。
本稿は以下のとおりである。
1. KonX を用いて, 表示解像度の変化によるラベルシフトの実証的証拠を提供する。
2. 客観的 iqa 手法にはスケールバイアスがあり,予測性能が低下することを示す。
3) 従来のIQAモデルよりも性能が向上するマルチスケール・マルチカラムDNNアーキテクチャを提案する。
そこで我々は,画像品質評価における新たな研究課題を提起し,解決する。
関連論文リスト
- DP-IQA: Utilizing Diffusion Prior for Blind Image Quality Assessment in the Wild [54.139923409101044]
野生のブラインド画像品質評価(IQA)は重大な課題を呈している。
大規模なトレーニングデータの収集が困難であることを考えると、厳密な一般化モデルを開発するために限られたデータを活用することは、未解決の問題である。
事前訓練されたテキスト・ツー・イメージ(T2I)拡散モデルの堅牢な画像認識能力により,新しいIQA法,拡散先行に基づくIQAを提案する。
論文 参考訳(メタデータ) (2024-05-30T12:32:35Z) - Descriptive Image Quality Assessment in the Wild [25.503311093471076]
VLMに基づく画像品質評価(IQA)は、画像品質を言語的に記述し、人間の表現に合わせることを目指している。
野生における画像品質評価(DepictQA-Wild)について紹介する。
本手法は,評価タスクと比較タスク,簡潔かつ詳細な応答,完全参照,非参照シナリオを含む多機能IQAタスクパラダイムを含む。
論文 参考訳(メタデータ) (2024-05-29T07:49:15Z) - Cross-IQA: Unsupervised Learning for Image Quality Assessment [3.2287957986061038]
本稿では,視覚変換器(ViT)モデルに基づく非参照画像品質評価(NR-IQA)手法を提案する。
提案手法は,ラベルのない画像データから画像品質の特徴を学習することができる。
実験結果から,Cross-IQAは低周波劣化情報の評価において最先端の性能が得られることが示された。
論文 参考訳(メタデータ) (2024-05-07T13:35:51Z) - Multi-Modal Prompt Learning on Blind Image Quality Assessment [65.0676908930946]
画像品質評価(IQA)モデルは意味情報から大きな恩恵を受け、異なる種類のオブジェクトを明瞭に扱うことができる。
十分な注釈付きデータが不足している従来の手法では、セマンティックな認識を得るために、CLIPイメージテキスト事前学習モデルをバックボーンとして使用していた。
近年のアプローチでは、このミスマッチに即時技術を使って対処する試みがあるが、これらの解決策には欠点がある。
本稿では、IQAのための革新的なマルチモーダルプロンプトベースの手法を提案する。
論文 参考訳(メタデータ) (2024-04-23T11:45:32Z) - Blind Image Quality Assessment via Vision-Language Correspondence: A
Multitask Learning Perspective [93.56647950778357]
ブラインド画像品質評価(BIQA)は、参照情報なしで画像品質の人間の知覚を予測する。
我々は,他のタスクからの補助的知識を活用するために,BIQAのための汎用的かつ自動化されたマルチタスク学習手法を開発した。
論文 参考訳(メタデータ) (2023-03-27T07:58:09Z) - MSTRIQ: No Reference Image Quality Assessment Based on Swin Transformer
with Multi-Stage Fusion [8.338999282303755]
本稿では,Swin Transformerに基づく新しいアルゴリズムを提案する。
ローカル機能とグローバル機能の両方から情報を集約して、品質をより正確に予測する。
NTIRE 2022 Perceptual Image Quality Assessment Challengeのノーレファレンストラックで2位。
論文 参考訳(メタデータ) (2022-05-20T11:34:35Z) - Image Quality Assessment using Contrastive Learning [50.265638572116984]
我々は、補助的な問題を解決するために、対照的な対の目的を用いて深層畳み込みニューラルネットワーク(CNN)を訓練する。
本研究では,最新のNR画像品質モデルと比較して,ContriQUEが競争性能を向上することを示す。
以上の結果から,大きなラベル付き主観的画像品質データセットを必要とせずに,知覚的関連性を持つ強力な品質表現が得られることが示唆された。
論文 参考訳(メタデータ) (2021-10-25T21:01:00Z) - Cross-Quality LFW: A Database for Analyzing Cross-Resolution Image Face
Recognition in Unconstrained Environments [8.368543987898732]
現実世界の顔認識アプリケーションは、異なるキャプチャ条件のために、最適な画像の品質や解像度を扱うことが多い。
最近のクロスレゾリューション顔認識手法は、画像品質における現実のエッジケースとの距離を測定するために、単純で任意で非現実的なダウンスケールとアップスケーリングの手法を用いている。
本稿では,Wildにおける有名なラベル付き顔から派生した,新しい標準ベンチマークデータセットと評価プロトコルを提案する。
論文 参考訳(メタデータ) (2021-08-23T17:04:32Z) - MUSIQ: Multi-scale Image Quality Transformer [22.908901641767688]
現在のIQA法は畳み込みニューラルネットワーク(CNN)に基づいている
マルチスケール画像品質変換器(MUSIQ)を設計し,サイズやアスペクト比の異なるネイティブ解像度画像を処理する。
提案手法は,マルチスケールの画像表現により,様々な粒度で画像品質を捉えることができる。
論文 参考訳(メタデータ) (2021-08-12T23:36:22Z) - Uncertainty-Aware Blind Image Quality Assessment in the Laboratory and
Wild [98.48284827503409]
我々は,テキスト化BIQAモデルを開発し,それを合成的および現実的歪みの両方で訓練するアプローチを提案する。
我々は、多数の画像ペアに対してBIQAのためのディープニューラルネットワークを最適化するために、忠実度損失を用いる。
6つのIQAデータベースの実験は、実験室と野生動物における画像品質を盲目的に評価する学習手法の可能性を示唆している。
論文 参考訳(メタデータ) (2020-05-28T13:35:23Z) - MetaIQA: Deep Meta-learning for No-Reference Image Quality Assessment [73.55944459902041]
本稿では,深層メタラーニングに基づく非参照IQA尺度を提案する。
まず、様々な歪みに対してNR-IQAタスクを収集する。
次にメタラーニングを用いて、多彩な歪みによって共有される事前知識を学習する。
大規模な実験により、提案された計量は最先端の技術を大きなマージンで上回ることを示した。
論文 参考訳(メタデータ) (2020-04-11T23:36:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。