論文の概要: UHD-IQA Benchmark Database: Pushing the Boundaries of Blind Photo Quality Assessment
- arxiv url: http://arxiv.org/abs/2406.17472v2
- Date: Wed, 4 Sep 2024 09:34:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-07 02:22:00.829535
- Title: UHD-IQA Benchmark Database: Pushing the Boundaries of Blind Photo Quality Assessment
- Title(参考訳): UHD-IQAベンチマークデータベース:ブラインド写真品質評価の境界を押し上げる
- Authors: Vlad Hosu, Lorenzo Agnolucci, Oliver Wiedemann, Daisuke Iso, Dietmar Saupe,
- Abstract要約: 固定幅3840ピクセルの6073 UHD-1 (4K)画像からなる画像品質評価データセットを提案する。
私たちの作品は、高い技術品質の高度に美的な写真に焦点を当てており、文学のギャップを埋めています。
データセットには、クラウドソーシング調査を通じて得られた知覚的品質評価が注釈付けされている。
- 参考スコア(独自算出の注目度): 4.563959812257119
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce a novel Image Quality Assessment (IQA) dataset comprising 6073 UHD-1 (4K) images, annotated at a fixed width of 3840 pixels. Contrary to existing No-Reference (NR) IQA datasets, ours focuses on highly aesthetic photos of high technical quality, filling a gap in the literature. The images, carefully curated to exclude synthetic content, are sufficiently diverse to train general NR-IQA models. Importantly, the dataset is annotated with perceptual quality ratings obtained through a crowdsourcing study. Ten expert raters, comprising photographers and graphics artists, assessed each image at least twice in multiple sessions spanning several days, resulting in 20 highly reliable ratings per image. Annotators were rigorously selected based on several metrics, including self-consistency, to ensure their reliability. The dataset includes rich metadata with user and machine-generated tags from over 5,000 categories and popularity indicators such as favorites, likes, downloads, and views. With its unique characteristics, such as its focus on high-quality images, reliable crowdsourced annotations, and high annotation resolution, our dataset opens up new opportunities for advancing perceptual image quality assessment research and developing practical NR-IQA models that apply to modern photos. Our dataset is available at https://database.mmsp-kn.de/uhd-iqa-benchmark-database.html
- Abstract(参考訳): 固定幅3840ピクセルの6073 UHD-1 (4K) 画像からなる画像品質評価(IQA)データセットを提案する。
既存のNo-Reference (NR) IQAデータセットとは対照的に、我々の研究は高い技術的品質の高度に美的な写真に焦点を当てており、文献のギャップを埋めている。
画像は、合成内容を排除するために慎重にキュレートされ、一般的なNR-IQAモデルを訓練するのに十分な多様性がある。
重要なのは、このデータセットに、クラウドソーシング調査によって得られた知覚的品質評価が注釈付けされていることだ。
写真家とグラフィックアーティストからなる10人の専門家ラッカーは、複数のセッションで少なくとも2回は画像を評価し、1枚あたり20の信頼性の高い評価を得た。
アノテーションは信頼性を確保するために、自己整合性を含むいくつかの指標に基づいて厳選された。
データセットには、5000以上のカテゴリのユーザとマシン生成タグによる豊富なメタデータと、お気に入り、お気に入り、ダウンロード、ビューなどの人気指標が含まれている。
高品質な画像、信頼できるクラウドソースアノテーション、高アノテーション解決などの特徴により、我々のデータセットは、知覚的画像品質評価研究を推進し、現代の写真に適用可能な実用的なNR-IQAモデルを開発する新たな機会を開く。
私たちのデータセットはhttps://database.mmsp-kn.de/uhd-iqa-benchmark-database.htmlで公開されています。
関連論文リスト
- Q-Ground: Image Quality Grounding with Large Multi-modality Models [61.72022069880346]
Q-Groundは、大規模な視覚的品質グラウンドに取り組むための最初のフレームワークである。
Q-Groundは、大規模なマルチモダリティモデルと詳細な視覚的品質分析を組み合わせる。
コントリビューションの中心は、QGround-100Kデータセットの導入です。
論文 参考訳(メタデータ) (2024-07-24T06:42:46Z) - DP-IQA: Utilizing Diffusion Prior for Blind Image Quality Assessment in the Wild [54.139923409101044]
拡散先行型IQA(DP-IQA)と呼ばれる新しいIQA法を提案する。
トレーニング済みの安定拡散をバックボーンとして使用し、復調するU-Netから多レベル特徴を抽出し、それらをデコードして画質スコアを推定する。
上記のモデルの知識をCNNベースの学生モデルに抽出し、適用性を高めるためにパラメータを大幅に削減する。
論文 参考訳(メタデータ) (2024-05-30T12:32:35Z) - Descriptive Image Quality Assessment in the Wild [25.503311093471076]
VLMに基づく画像品質評価(IQA)は、画像品質を言語的に記述し、人間の表現に合わせることを目指している。
野生における画像品質評価(DepictQA-Wild)について紹介する。
本手法は,評価タスクと比較タスク,簡潔かつ詳細な応答,完全参照,非参照シナリオを含む多機能IQAタスクパラダイムを含む。
論文 参考訳(メタデータ) (2024-05-29T07:49:15Z) - Dual-Branch Network for Portrait Image Quality Assessment [76.27716058987251]
ポートレート画像品質評価のためのデュアルブランチネットワーク(PIQA)を提案する。
我々は2つのバックボーンネットワーク(textiti.e., Swin Transformer-B)を使用して、肖像画全体と顔画像から高品質な特徴を抽出する。
我々は、画像シーンの分類と品質評価モデルであるLIQEを利用して、品質認識とシーン固有の特徴を補助的特徴として捉えている。
論文 参考訳(メタデータ) (2024-05-14T12:43:43Z) - Cross-IQA: Unsupervised Learning for Image Quality Assessment [3.2287957986061038]
本稿では,視覚変換器(ViT)モデルに基づく非参照画像品質評価(NR-IQA)手法を提案する。
提案手法は,ラベルのない画像データから画像品質の特徴を学習することができる。
実験結果から,Cross-IQAは低周波劣化情報の評価において最先端の性能が得られることが示された。
論文 参考訳(メタデータ) (2024-05-07T13:35:51Z) - Depicting Beyond Scores: Advancing Image Quality Assessment through Multi-modal Language Models [28.194638379354252]
本稿では,従来のスコアベース手法の制約を克服するDepicted Image Quality Assessment法(DepictQA)を提案する。
DepictQAは、マルチモーダルな大規模言語モデルを利用することで、詳細な言語ベースの人間のような画像品質の評価を可能にする。
これらの結果はマルチモーダルIQA法の研究の可能性を示している。
論文 参考訳(メタデータ) (2023-12-14T14:10:02Z) - An Image Quality Assessment Dataset for Portraits [0.9786690381850354]
本稿では,PIQ23について紹介する。PIQ23は,100台のスマートフォンが取得した50のシナリオの5116枚の画像からなる,ポートレート固有のIQAデータセットである。
このデータセットには、さまざまな性別や民族の個人が含まれており、公開研究に使用される写真について、明確かつインフォームドな同意を与えている。
これらのアノテーションの詳細な統計解析により、PIQ23上での一貫性を評価することができる。
論文 参考訳(メタデータ) (2023-04-12T11:30:06Z) - Blind Multimodal Quality Assessment: A Brief Survey and A Case Study of
Low-light Images [73.27643795557778]
ブラインド画像品質評価(BIQA)は、視覚信号の客観的スコアを自動的に正確に予測することを目的としている。
この分野での最近の発展は、ヒトの主観的評価パターンと矛盾しない一助的解によって支配されている。
主観的評価から客観的スコアへの低照度画像の一意なブラインドマルチモーダル品質評価(BMQA)を提案する。
論文 参考訳(メタデータ) (2023-03-18T09:04:55Z) - Conformer and Blind Noisy Students for Improved Image Quality Assessment [80.57006406834466]
知覚品質評価(IQA)のための学習ベースアプローチは、通常、知覚品質を正確に測定するために歪んだ画像と参照画像の両方を必要とする。
本研究では,変換器を用いた全参照IQAモデルの性能について検討する。
また,全教師モデルから盲人学生モデルへの半教師付き知識蒸留に基づくIQAの手法を提案する。
論文 参考訳(メタデータ) (2022-04-27T10:21:08Z) - BIQ2021: A Large-Scale Blind Image Quality Assessment Database [1.3670071336891754]
本稿ではBlind Image Quality Assessment Database, BIQ2021を紹介する。
データセットは、画像品質評価に使用する意図のないもの、意図的に導入した自然な歪みで撮影したもの、オープンソースの画像共有プラットフォームから撮影したもの、の3つのセットで構成されている。
データベースは、主観的スコアリング、人体統計、および各画像の標準偏差に関する情報を含む。
論文 参考訳(メタデータ) (2022-02-08T14:07:38Z) - Learning Conditional Knowledge Distillation for Degraded-Reference Image
Quality Assessment [157.1292674649519]
劣化参照IQA(DR-IQA)という実用的な解を提案する。
DR-IQAはIRモデルの入力、劣化したイメージを参照として利用する。
私たちの結果は、フル参照設定のパフォーマンスに近いものもあります。
論文 参考訳(メタデータ) (2021-08-18T02:35:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。