論文の概要: Enriching ImageNet with Human Similarity Judgments and Psychological
Embeddings
- arxiv url: http://arxiv.org/abs/2011.11015v1
- Date: Sun, 22 Nov 2020 13:41:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-22 08:59:33.828188
- Title: Enriching ImageNet with Human Similarity Judgments and Psychological
Embeddings
- Title(参考訳): 人間の類似性判断と心理的埋め込みによるイメージネットの充実
- Authors: Brett D. Roads, Bradley C. Love
- Abstract要約: 人間の知覚と推論のタスク汎用能力を具現化したデータセットを提案する。
ImageNet(ImageNet-HSJ)のHuman similarity Judgments拡張は、人間の類似性判定で構成されている。
新しいデータセットは、教師なし学習アルゴリズムの評価を含む、タスクとパフォーマンスのメトリクスの範囲をサポートする。
- 参考スコア(独自算出の注目度): 7.6146285961466
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Advances in object recognition flourished in part because of the availability
of high-quality datasets and associated benchmarks. However, these
benchmarks---such as ILSVRC---are relatively task-specific, focusing
predominately on predicting class labels. We introduce a publicly-available
dataset that embodies the task-general capabilities of human perception and
reasoning. The Human Similarity Judgments extension to ImageNet (ImageNet-HSJ)
is composed of human similarity judgments that supplement the ILSVRC validation
set. The new dataset supports a range of task and performance metrics,
including the evaluation of unsupervised learning algorithms. We demonstrate
two methods of assessment: using the similarity judgments directly and using a
psychological embedding trained on the similarity judgments. This embedding
space contains an order of magnitude more points (i.e., images) than previous
efforts based on human judgments. Scaling to the full 50,000 image set was made
possible through a selective sampling process that used variational Bayesian
inference and model ensembles to sample aspects of the embedding space that
were most uncertain. This methodological innovation not only enables scaling,
but should also improve the quality of solutions by focusing sampling where it
is needed. To demonstrate the utility of ImageNet-HSJ, we used the similarity
ratings and the embedding space to evaluate how well several popular models
conform to human similarity judgments. One finding is that more complex models
that perform better on task-specific benchmarks do not better conform to human
semantic judgments. In addition to the human similarity judgments, pre-trained
psychological embeddings and code for inferring variational embeddings are made
publicly available. Collectively, ImageNet-HSJ assets support the appraisal of
internal representations and the development of more human-like models.
- Abstract(参考訳): オブジェクト認識の進歩の一部は、高品質なデータセットと関連するベンチマークが利用可能であることによる。
しかし、ILSVRCのようなこれらのベンチマークは比較的タスク固有であり、クラスラベルの予測に重点を置いている。
人間の知覚と推論のタスク汎用能力を具現化した公開データセットを提案する。
ImageNet(ImageNet-HSJ)のHuman similarity Judgments拡張は、ILSVRC検証セットを補完する人間の類似性判定で構成されている。
新しいデータセットは、教師なし学習アルゴリズムの評価を含む、さまざまなタスクおよびパフォーマンスメトリクスをサポートする。
類似性判定を直接用いたり、類似性判定に基づいて訓練された心理学的埋め込みを用いて評価を行う。
この埋め込み空間は、人間の判断に基づく以前の取り組みよりも桁違いに多くの点(すなわち画像)を含む。
5万枚の画像集合へのスケーリングは、変分ベイズ推論とモデルアンサンブルを用いて最も不確実な埋め込み空間のアスペクトをサンプリングする選択的サンプリングプロセスによって可能となった。
この方法論的な革新は、スケーリングを可能にするだけでなく、必要なサンプリングに集中することで、ソリューションの品質を向上させる必要がある。
ImageNet-HSJの有用性を実証するために、我々は類似度評価と埋め込み空間を用いて、複数の人気モデルが人間の類似度判定にどの程度うまく適合しているかを評価する。
1つの発見は、タスク固有のベンチマークでより良いパフォーマンスを示すより複雑なモデルは、人間の意味判断に適合しないということである。
人間の類似性判断に加えて、事前訓練された心理埋め込みと変分埋め込みを推測するためのコードも公開されている。
総じて、imagenet-hsjアセットは内部表現の評価とより人間的なモデルの開発をサポートする。
関連論文リスト
- Self-Training with Pseudo-Label Scorer for Aspect Sentiment Quad Prediction [54.23208041792073]
Aspect Sentiment Quad Prediction (ASQP) は、与えられたレビューに対して全てのクワッド(アスペクト項、アスペクトカテゴリー、意見項、感情極性)を予測することを目的としている。
ASQPタスクにおける重要な課題はラベル付きデータの不足であり、既存のメソッドのパフォーマンスを制限している。
そこで我々は,擬似ラベルスコアラーを用いた自己学習フレームワークを提案し,レビューと擬似ラベルの一致をスコアラーが評価する。
論文 参考訳(メタデータ) (2024-06-26T05:30:21Z) - Beyond MOS: Subjective Image Quality Score Preprocessing Method Based on Perceptual Similarity [2.290956583394892]
ITU-R BT.500、ITU-T P.910、ITU-T P.913は、当初の世論点をクリアするために標準化されている。
PSPは画像間の知覚的類似性を利用して、より注釈の少ないシナリオにおける主観的バイアスを軽減する。
論文 参考訳(メタデータ) (2024-04-30T16:01:14Z) - Evaluating the Fairness of Discriminative Foundation Models in Computer
Vision [51.176061115977774]
本稿では,CLIP (Contrastive Language-Pretraining) などの差別基盤モデルのバイアス評価のための新しい分類法を提案する。
そして、これらのモデルにおけるバイアスを緩和するための既存の手法を分類学に関して体系的に評価する。
具体的には,ゼロショット分類,画像検索,画像キャプションなど,OpenAIのCLIPとOpenCLIPモデルをキーアプリケーションとして評価する。
論文 参考訳(メタデータ) (2023-10-18T10:32:39Z) - Efficient Discovery and Effective Evaluation of Visual Perceptual
Similarity: A Benchmark and Beyond [20.035369732786407]
110K以上の専門家が注釈付けした画像ペアからなる,最初の大規模な視覚的類似度ベンチマークデータセットを紹介する。
本稿では,任意のデータセットに適用可能な,新規で効率的なラベル付け手法を提案する。
論文 参考訳(メタデータ) (2023-08-28T17:59:47Z) - Revisiting the Evaluation of Image Synthesis with GANs [55.72247435112475]
本研究では, 合成性能の評価に関する実証的研究を行い, 生成モデルの代表としてGAN(Generative Adversarial Network)を用いた。
特に、表現空間におけるデータポイントの表現方法、選択したサンプルを用いた公平距離の計算方法、各集合から使用可能なインスタンス数など、さまざまな要素の詳細な分析を行う。
論文 参考訳(メタデータ) (2023-04-04T17:54:32Z) - Fairness meets Cross-Domain Learning: a new perspective on Models and
Metrics [80.07271410743806]
クロスドメイン学習(CD)とモデルフェアネスの関係について検討する。
いくつかの人口集団にまたがる顔画像と医療画像のベンチマークと、分類とローカライゼーションタスクについて紹介する。
本研究は,3つの最先端フェアネスアルゴリズムとともに,14のCDアプローチをカバーし,前者が後者に勝ることを示す。
論文 参考訳(メタデータ) (2023-03-25T09:34:05Z) - Self-similarity Driven Scale-invariant Learning for Weakly Supervised
Person Search [66.95134080902717]
自己相似性駆動型スケール不変学習(SSL)という新しいワンステップフレームワークを提案する。
本稿では,ネットワークを前景と学習スケール不変の機能に集中させるための,マルチスケール・エクステンプラー・ブランチを提案する。
PRWおよびCUHK-SYSUデータベースの実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2023-02-25T04:48:11Z) - TISE: A Toolbox for Text-to-Image Synthesis Evaluation [9.092600296992925]
単目的と多目的のテキスト・ツー・イメージ合成のための最先端手法の研究を行う。
これらの手法を評価するための共通フレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-02T16:39:35Z) - SDD-FIQA: Unsupervised Face Image Quality Assessment with Similarity
Distribution Distance [25.109321001368496]
顔画像品質評価(FIQA)は顔認識システムの不可欠な部分となっています。
顔画像品質評価(SDD-FIQA)に類似度分布距離を組み込んだ新しい非監視FIQA法を提案する。
本手法は,クラス内類似度分布とクラス間類似度分布の間のWasserstein Distanceを計算することにより,品質疑似ラベルを生成する。
論文 参考訳(メタデータ) (2021-03-10T10:23:28Z) - Validation and generalization of pixel-wise relevance in convolutional
neural networks trained for face classification [0.0]
重要モデルのパラメータ間で、関連度がどう異なるかを示し、一般化する。
関連性に基づく画像マスキングにより、顔分類の関連マップは一般に安定であることが判明した。
モデル間の関係写像の詳細な解析により、選択パラメータの特定の利点を示す一般化における非対称性が明らかになった。
論文 参考訳(メタデータ) (2020-06-16T23:20:40Z) - Gradient-Induced Co-Saliency Detection [81.54194063218216]
Co-SOD(Co-saliency Detection)は、一般的な唾液前景を関連画像のグループに分割することを目的としている。
本稿では,人間の行動にインスパイアされた,勾配誘導型共分散検出法を提案する。
論文 参考訳(メタデータ) (2020-04-28T08:40:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。