論文の概要: Evaluating Perceptual Distance Models by Fitting Binomial Distributions to Two-Alternative Forced Choice Data
- arxiv url: http://arxiv.org/abs/2403.10390v2
- Date: Thu, 03 Oct 2024 17:10:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-04 23:29:40.276242
- Title: Evaluating Perceptual Distance Models by Fitting Binomial Distributions to Two-Alternative Forced Choice Data
- Title(参考訳): 二項分布を2つの交互強制選択データに適合させることによる知覚距離モデルの評価
- Authors: Alexander Hepburn, Raul Santos-Rodriguez, Javier Portilla,
- Abstract要約: クラウドソースの知覚データセットが登場し、三つ子間で画像が共有されないため、ランク付けが不可能になった。
両面分布を用いた2AFC実験において,基礎となる意思決定過程を統計的にモデル化する。
距離モデルに対する有意義かつ十分に確立されたメトリクスを、単なる予測精度をパーセンテージ・アグリーメントとして計算する。
- 参考スコア(独自算出の注目度): 47.18802526899955
- License:
- Abstract: The two-alternative forced choice (2AFC) experimental method is popular in the visual perception literature, where practitioners aim to understand how human observers perceive distances within triplets made of a reference image and two distorted versions. In the past, this had been conducted in controlled environments, with triplets sharing images, so it was possible to rank the perceived quality. This ranking would then be used to evaluate perceptual distance models against the experimental data. Recently, crowd-sourced perceptual datasets have emerged, with no images shared between triplets, making ranking infeasible. Evaluating perceptual distance models using this data reduces the judgements on a triplet to a binary decision, namely, whether the distance model agrees with the human decision - which is suboptimal and prone to misleading conclusions. Instead, we statistically model the underlying decision-making process during 2AFC experiments using a binomial distribution. Having enough empirical data, we estimate a smooth and consistent distribution of the judgements on the reference-distorted distance plane, according to each distance model. By applying maximum likelihood, we estimate the parameter of the local binomial distribution, and a global measurement of the expected log-likelihood of the measured responses. We calculate meaningful and well-founded metrics for the distance model, beyond the mere prediction accuracy as percentage agreement, even with variable numbers of judgements per triplet -- key advantages over both classical and neural network methods.
- Abstract(参考訳): 2-alternative forced choice (2AFC) 実験法は、人間の観察者が基準画像と2つの歪んだバージョンで作られた三重項内の距離をどう知覚するかを理解することを目的として、視覚知覚文学において人気がある。
過去には、これらは三重項が画像を共有する制御された環境で行われており、知覚された品質のランク付けが可能であった。
このランキングは、実験データに対して知覚距離モデルを評価するために使用される。
最近、クラウドソーシングされた知覚データセットが登場し、トレーレット間で画像が共有されず、ランキングが実現不可能になった。
このデータを用いて知覚距離モデルを評価することは、三重項上の判断を二分決定に還元する。
代わりに、二項分布を用いた2AFC実験において、基礎となる意思決定過程を統計的にモデル化する。
各距離モデルにより,十分な経験的データを得た場合,基準歪距離平面上の判断の円滑かつ一貫した分布を推定する。
最大確率を適用することで、局所二項分布のパラメータと、測定された応答の対数分布のグローバルな測定を推定する。
従来のニューラルネットワーク手法とニューラルネットワーク手法の主な利点である三重項あたりの判定数の変動であっても、単なる予測精度をパーセンテージの一致として、距離モデルの有意義で十分に確立されたメトリクスを計算します。
関連論文リスト
- Modeling the Uncertainty with Maximum Discrepant Students for
Semi-supervised 2D Pose Estimation [57.17120203327993]
半教師付きポーズ推定タスクにおける擬似ラベルの品質を推定する枠組みを提案する。
提案手法は,3つのデータセットに対する半教師付きポーズ推定の性能を向上させる。
論文 参考訳(メタデータ) (2023-11-03T08:11:06Z) - DiffPose: Multi-hypothesis Human Pose Estimation using Diffusion models [5.908471365011943]
与えられた入力画像に対して複数の仮説を予測する条件拡散モデルであるemphDiffPoseを提案する。
DiffPoseは, 簡単なポーズの多面的ポーズを推定し, 極めてあいまいなポーズに対して大きなマージンで優れることを示す。
論文 参考訳(メタデータ) (2022-11-29T18:55:13Z) - Composed Image Retrieval with Text Feedback via Multi-grained
Uncertainty Regularization [73.04187954213471]
粗い検索ときめ細かい検索を同時にモデル化する統合学習手法を提案する。
提案手法は、強いベースラインに対して+4.03%、+3.38%、+2.40%のRecall@50精度を達成した。
論文 参考訳(メタデータ) (2022-11-14T14:25:40Z) - Multi-view object pose estimation from correspondence distributions and
epipolar geometry [0.0]
本稿では,学習した2D-3D分布を,初期推定と任意修正の両方のために複数の視点から集約する多視点ポーズ推定手法を提案する。
提案手法は,最も優れた単一視点法と比較して,ポーズ推定誤差を80~91%削減する。
論文 参考訳(メタデータ) (2022-10-03T13:30:40Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Deblurring via Stochastic Refinement [85.42730934561101]
条件付き拡散モデルに基づくブラインドデブロアリングのための代替フレームワークを提案する。
提案手法は,PSNRなどの歪み指標の点で競合する。
論文 参考訳(メタデータ) (2021-12-05T04:36:09Z) - Visual Recognition with Deep Learning from Biased Image Datasets [6.10183951877597]
視覚認知の文脈において、バイアスモデルがどのように治療問題に適用できるかを示す。
作業中のバイアス機構に関する(近似的な)知識に基づいて、我々のアプローチは観察を再重み付けする。
本稿では,画像データベース間で共有される低次元画像表現を提案する。
論文 参考訳(メタデータ) (2021-09-06T10:56:58Z) - Self-Paced Uncertainty Estimation for One-shot Person Re-Identification [9.17071384578203]
本稿では,単発人物の自己ペース不確実性推定ネットワーク(spue-net)を提案する。
自己ペースサンプリング戦略を導入することで,ラベルなしサンプルの擬似ラベルを反復的に推定し,ラベル付きサンプルを拡張できる。
さらに,局所不確実性推定と決定性推定を併用した協調学習手法を適用し,より優れた隠れ空間特徴抽出を実現する。
論文 参考訳(メタデータ) (2021-04-19T09:20:30Z) - Multi-person 3D Pose Estimation in Crowded Scenes Based on Multi-View
Geometry [62.29762409558553]
マルチパーソナライズされた3次元ポーズ推定手法における特徴マッチングと深さ推定のコアは、エピポーラ制約である。
スパサーの群衆シーンにおけるこの定式化の良好なパフォーマンスにもかかわらず、その効果はより密集した群衆の状況下でしばしば挑戦される。
本稿では,マルチパーソン3次元ポーズ推定式から脱却し,群衆ポーズ推定として再編成する。
論文 参考訳(メタデータ) (2020-07-21T17:59:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。