論文の概要: RAID-Database: human Responses to Affine Image Distortions
- arxiv url: http://arxiv.org/abs/2412.10211v1
- Date: Fri, 13 Dec 2024 15:34:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-16 15:01:36.281941
- Title: RAID-Database: human Responses to Affine Image Distortions
- Title(参考訳): RAIDデータベース:アフィン画像歪みに対する人間の反応
- Authors: Paula Daudén-Oliver, David Agost-Beltran, Emilio Sansano-Sansano, Valero Laparra, Jesús Malo, Marina Martínez-Garcia,
- Abstract要約: このデータ記述子は、上垂体アフィン画像変換に対する人間の反応のセットを提示する。
これらの反応は、確立された精神物理学(最大相違尺度法)を用いて測定された。
実験では、105人の観察者、20000人以上の画像の比較が行われた。
- 参考スコア(独自算出の注目度): 0.9983756430443304
- License:
- Abstract: Image quality databases are used to train models for predicting subjective human perception. However, most existing databases focus on distortions commonly found in digital media and not in natural conditions. Affine transformations are particularly relevant to study, as they are among the most commonly encountered by human observers in everyday life. This Data Descriptor presents a set of human responses to suprathreshold affine image transforms (rotation, translation, scaling) and Gaussian noise as convenient reference to compare with previously existing image quality databases. The responses were measured using well established psychophysics: the Maximum Likelihood Difference Scaling method. The set contains responses to 864 distorted images. The experiments involved 105 observers and more than 20000 comparisons of quadruples of images. The quality of the dataset is ensured because (a) it reproduces the classical Pi\'eron's law, (b) it reproduces classical absolute detection thresholds, and (c) it is consistent with conventional image quality databases but improves them according to Group-MAD experiments.
- Abstract(参考訳): 画像品質データベースは、主観的人間の知覚を予測するためのモデルを訓練するために使用される。
しかし、既存のデータベースのほとんどは、デジタルメディアで一般的に見られる歪みに焦点を合わせており、自然条件には当てはまらない。
アフィン変換は特に研究に関係があり、人間の観察者が日常生活で最もよく目にするものである。
このデータ記述子は、既存の画像品質データベースと比較するために、サプラスレッショルドアフィン画像変換(回転、翻訳、スケーリング)とガウスノイズに対する人間の反応のセットを便利な参照として提示する。
これらの反応は、確立された精神物理学(最大相違尺度法)を用いて測定された。
このセットは、864の歪んだ画像に対する応答を含んでいる。
実験には105人の観察者と20000以上の画像の比較が含まれていた。
データセットの品質が保証されるのは、
(a)古典的なピエロンの法則を再現する。
b)古典的な絶対検出閾値を再現し、
(c)従来の画像品質データベースと一致しているが,グループMAD実験により改善されている。
関連論文リスト
- Beyond MOS: Subjective Image Quality Score Preprocessing Method Based on Perceptual Similarity [2.290956583394892]
ITU-R BT.500、ITU-T P.910、ITU-T P.913は、当初の世論点をクリアするために標準化されている。
PSPは画像間の知覚的類似性を利用して、より注釈の少ないシナリオにおける主観的バイアスを軽減する。
論文 参考訳(メタデータ) (2024-04-30T16:01:14Z) - Invisible Relevance Bias: Text-Image Retrieval Models Prefer AI-Generated Images [67.18010640829682]
我々は,AI生成画像がテキスト画像検索モデルに目に見えない関連性バイアスをもたらすことを示す。
検索モデルのトレーニングデータにAI生成画像を含めると、目に見えない関連性バイアスが増す。
本研究では,目に見えない関連バイアスを軽減するための効果的なトレーニング手法を提案する。
論文 参考訳(メタデータ) (2023-11-23T16:22:58Z) - Privacy Assessment on Reconstructed Images: Are Existing Evaluation
Metrics Faithful to Human Perception? [86.58989831070426]
本研究では,手作りのメトリクスの忠実さを,再構成画像からの人間のプライバシー情報の認識に適用する。
本稿では,SemSimと呼ばれる学習に基づく尺度を提案し,オリジナル画像と再構成画像のセマンティック類似性を評価する。
論文 参考訳(メタデータ) (2023-09-22T17:58:04Z) - Balancing the Picture: Debiasing Vision-Language Datasets with Synthetic
Contrast Sets [52.77024349608834]
視覚言語モデルは、インターネットから未計算の画像テキストペアの事前トレーニング中に学んだ社会的バイアスを永続し、増幅することができる。
COCO Captionsは、背景コンテキストとその場にいる人々の性別間のバイアスを評価するために最も一般的に使用されるデータセットである。
本研究では,COCOデータセットを男女バランスの取れたコントラストセットで拡張する新しいデータセットデバイアスパイプラインを提案する。
論文 参考訳(メタデータ) (2023-05-24T17:59:18Z) - Deep Ensembling for Perceptual Image Quality Assessment [0.9424650988057943]
我々は2つのCNNアーキテクチャをサブユニットとして含むディープアーキテクチャを設計した。
自然歪みを有する12,000枚の画像を用いた自己収集画像データベースBIQ2021を提案する。
合成歪みを伴う1875万の画像からなる大規模なデータベースを用いて、モデルを事前トレーニングし、評価のためにベンチマークデータベースで再トレーニングする。
論文 参考訳(メタデータ) (2023-05-16T03:45:02Z) - Performance of GAN-based augmentation for deep learning COVID-19 image
classification [57.1795052451257]
ディープラーニングを医療分野に適用する上で最大の課題は、トレーニングデータの提供である。
データ拡張は、限られたデータセットに直面した時に機械学習で使用される典型的な方法論である。
本研究は, 新型コロナウイルスの胸部X線画像セットを限定して, StyleGAN2-ADAモデルを用いて訓練するものである。
論文 参考訳(メタデータ) (2023-04-18T15:39:58Z) - Perceptual Quality Assessment of Omnidirectional Images [81.76416696753947]
16のソース画像と320の歪み画像を含む全方位IQA (OIQA) データベースを最初に構築する。
そして、VR環境におけるOIQAデータベース上で主観的品質評価研究を行う。
原画像と歪んだ全方位画像、主観的品質評価、および頭部と眼の動きデータを合わせてOIQAデータベースを構成する。
論文 参考訳(メタデータ) (2022-07-06T13:40:38Z) - BIQ2021: A Large-Scale Blind Image Quality Assessment Database [1.3670071336891754]
本稿ではBlind Image Quality Assessment Database, BIQ2021を紹介する。
データセットは、画像品質評価に使用する意図のないもの、意図的に導入した自然な歪みで撮影したもの、オープンソースの画像共有プラットフォームから撮影したもの、の3つのセットで構成されている。
データベースは、主観的スコアリング、人体統計、および各画像の標準偏差に関する情報を含む。
論文 参考訳(メタデータ) (2022-02-08T14:07:38Z) - Unravelling the Effect of Image Distortions for Biased Prediction of
Pre-trained Face Recognition Models [86.79402670904338]
画像歪みの存在下での4つの最先端深層顔認識モデルの性能評価を行った。
我々は、画像歪みが、異なるサブグループ間でのモデルの性能ギャップと関係していることを観察した。
論文 参考訳(メタデータ) (2021-08-14T16:49:05Z) - Evaluating and Mitigating Bias in Image Classifiers: A Causal
Perspective Using Counterfactuals [27.539001365348906]
本稿では、逆学習推論(ALI)の改良版に構造因果モデル(SCM)を組み込むことにより、逆ファクトアルを生成する方法を提案する。
本稿では,事前学習された機械学習分類器の説明方法を示し,そのバイアスを評価し,そのバイアスを正則化器を用いて緩和する方法について述べる。
論文 参考訳(メタデータ) (2020-09-17T13:19:31Z) - Learning Numerical Observers using Unsupervised Domain Adaptation [13.548174682737756]
医用イメージングシステムは、客観的な画質測定によって一般的に評価される。
タスクベース画像品質評価のための数値オブザーバを実装するために,改良されたディープラーニング手法が検討されている。
大量の実験データをラベル付けして、ディープニューラルネットワークを訓練するのは、面倒で、高価で、主観的エラーの傾向があります。
論文 参考訳(メタデータ) (2020-02-03T22:58:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。