論文の概要: Evaluating Perceptual Distances by Fitting Binomial Distributions to Two-Alternative Forced Choice Data
- arxiv url: http://arxiv.org/abs/2403.10390v1
- Date: Fri, 15 Mar 2024 15:21:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-18 16:32:11.694042
- Title: Evaluating Perceptual Distances by Fitting Binomial Distributions to Two-Alternative Forced Choice Data
- Title(参考訳): 二項分布を2つの交互強制選択データに適合させることによる知覚距離の評価
- Authors: Alexander Hepburn, Raul Santos-Rodriguez, Javier Portilla,
- Abstract要約: クラウドソースの知覚データセットが登場し、三つ子間で画像が共有されないため、ランク付けが不可能になった。
両面分布を用いた2AFC実験において,基礎となる意思決定過程を統計的にモデル化する。
このようにして、三重項ごとに異なる判定数を評価することができ、距離のセットに応じて判断の確率などのメトリクスを計算することができる。
- 参考スコア(独自算出の注目度): 47.18802526899955
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The two-alternative forced choice (2AFC) experimental setup is popular in the visual perception literature, where practitioners aim to understand how human observers perceive distances within triplets that consist of a reference image and two distorted versions of that image. In the past, this had been conducted in controlled environments, with a tournament-style algorithm dictating which images are shown to each participant to rank the distorted images. Recently, crowd-sourced perceptual datasets have emerged, with no images shared between triplets, making ranking impossible. Evaluating perceptual distances using this data is non-trivial, relying on reducing the collection of judgements on a triplet to a binary decision -- which is suboptimal and prone to misleading conclusions. Instead, we statistically model the underlying decision-making process during 2AFC experiments using a binomial distribution. We use maximum likelihood estimation to fit a distribution to the perceptual judgements, conditioned on the perceptual distance to test and impose consistency and smoothness between our empirical estimates of the density. This way, we can evaluate a different number of judgements per triplet, and can calculate metrics such as likelihoods of judgements according to a set of distances -- key ingredients that neural network counterparts lack.
- Abstract(参考訳): 2-alternative forced choice (2AFC) 実験装置は視覚的知覚文学において、人間の観察者が基準画像と2つの歪んだ画像からなる三重項内の距離をどう知覚するかを理解することを目的としている。
過去には、各参加者が歪んだ画像をランク付けするトーナメントスタイルのアルゴリズムを用いて、制御された環境で実施されていた。
近年、クラウドソーシングされた知覚データセットが登場し、三つ子間で画像を共有することはなく、ランク付けが不可能になっている。
このデータを用いて知覚距離を評価することは簡単ではなく、三重項上の判断の収集を二項決定に還元することに頼っている。
代わりに、二項分布を用いた2AFC実験において、基礎となる意思決定過程を統計的にモデル化する。
我々は、最大推定値を用いて、知覚的判断に分布を適合させ、知覚的距離に条件付きでテストし、その密度の経験的推定値間の一貫性と滑らかさを課す。
このようにして、三重項ごとに異なる判断数を評価することができ、また、ニューラルネットワークが欠落している重要な要素である距離のセットに応じて判断の確率などのメトリクスを計算することができる。
関連論文リスト
- Modeling the Uncertainty with Maximum Discrepant Students for
Semi-supervised 2D Pose Estimation [57.17120203327993]
半教師付きポーズ推定タスクにおける擬似ラベルの品質を推定する枠組みを提案する。
提案手法は,3つのデータセットに対する半教師付きポーズ推定の性能を向上させる。
論文 参考訳(メタデータ) (2023-11-03T08:11:06Z) - DiffPose: Multi-hypothesis Human Pose Estimation using Diffusion models [5.908471365011943]
与えられた入力画像に対して複数の仮説を予測する条件拡散モデルであるemphDiffPoseを提案する。
DiffPoseは, 簡単なポーズの多面的ポーズを推定し, 極めてあいまいなポーズに対して大きなマージンで優れることを示す。
論文 参考訳(メタデータ) (2022-11-29T18:55:13Z) - Composed Image Retrieval with Text Feedback via Multi-grained
Uncertainty Regularization [73.04187954213471]
粗い検索ときめ細かい検索を同時にモデル化する統合学習手法を提案する。
提案手法は、強いベースラインに対して+4.03%、+3.38%、+2.40%のRecall@50精度を達成した。
論文 参考訳(メタデータ) (2022-11-14T14:25:40Z) - Multi-view object pose estimation from correspondence distributions and
epipolar geometry [0.0]
本稿では,学習した2D-3D分布を,初期推定と任意修正の両方のために複数の視点から集約する多視点ポーズ推定手法を提案する。
提案手法は,最も優れた単一視点法と比較して,ポーズ推定誤差を80~91%削減する。
論文 参考訳(メタデータ) (2022-10-03T13:30:40Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Deblurring via Stochastic Refinement [85.42730934561101]
条件付き拡散モデルに基づくブラインドデブロアリングのための代替フレームワークを提案する。
提案手法は,PSNRなどの歪み指標の点で競合する。
論文 参考訳(メタデータ) (2021-12-05T04:36:09Z) - Visual Recognition with Deep Learning from Biased Image Datasets [6.10183951877597]
視覚認知の文脈において、バイアスモデルがどのように治療問題に適用できるかを示す。
作業中のバイアス機構に関する(近似的な)知識に基づいて、我々のアプローチは観察を再重み付けする。
本稿では,画像データベース間で共有される低次元画像表現を提案する。
論文 参考訳(メタデータ) (2021-09-06T10:56:58Z) - Self-Paced Uncertainty Estimation for One-shot Person Re-Identification [9.17071384578203]
本稿では,単発人物の自己ペース不確実性推定ネットワーク(spue-net)を提案する。
自己ペースサンプリング戦略を導入することで,ラベルなしサンプルの擬似ラベルを反復的に推定し,ラベル付きサンプルを拡張できる。
さらに,局所不確実性推定と決定性推定を併用した協調学習手法を適用し,より優れた隠れ空間特徴抽出を実現する。
論文 参考訳(メタデータ) (2021-04-19T09:20:30Z) - Multi-person 3D Pose Estimation in Crowded Scenes Based on Multi-View
Geometry [62.29762409558553]
マルチパーソナライズされた3次元ポーズ推定手法における特徴マッチングと深さ推定のコアは、エピポーラ制約である。
スパサーの群衆シーンにおけるこの定式化の良好なパフォーマンスにもかかわらず、その効果はより密集した群衆の状況下でしばしば挑戦される。
本稿では,マルチパーソン3次元ポーズ推定式から脱却し,群衆ポーズ推定として再編成する。
論文 参考訳(メタデータ) (2020-07-21T17:59:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。