論文の概要: Measuring Human Perception to Improve Open Set Recognition
- arxiv url: http://arxiv.org/abs/2209.03519v2
- Date: Sun, 11 Sep 2022 20:25:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-13 10:35:59.701528
- Title: Measuring Human Perception to Improve Open Set Recognition
- Title(参考訳): オープンセット認識を改善するための人間の知覚の測定
- Authors: Jin Huang, Derek Prijatelj, Justin Dulay and Walter Scheirer
- Abstract要約: 深層ネットワークにおける人間の行動に整合性を持たせる新しい精神物理学的損失関数を設計する。
損失関数を持つモデルでは, トップ1検証精度が7%, 既知のサンプルでは18%, 未知サンプルでは1テスト精度が33%向上した。
- 参考スコア(独自算出の注目度): 4.124573231232705
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The human ability to recognize when an object is known or novel currently
outperforms all open set recognition algorithms. Human perception as measured
by the methods and procedures of visual psychophysics from psychology can
provide an additional data stream for managing novelty in visual recognition
tasks in computer vision. For instance, measured reaction time from human
subjects can offer insight as to whether a known class sample may be confused
with a novel one. In this work, we designed and performed a large-scale
behavioral experiment that collected over 200,000 human reaction time
measurements associated with object recognition. The data collected indicated
reaction time varies meaningfully across objects at the sample level. We
therefore designed a new psychophysical loss function that enforces consistency
with human behavior in deep networks which exhibit variable reaction time for
different images. As in biological vision, this approach allows us to achieve
good open set recognition performance in regimes with limited labeled training
data. Through experiments using data from ImageNet, significant improvement is
observed when training Multi-Scale DenseNets with this new formulation: models
trained with our loss function significantly improved top-1 validation accuracy
by 7%, top-1 test accuracy on known samples by 18%, and top-1 test accuracy on
unknown samples by 33%. We compared our method to 10 open set recognition
methods from the literature, which were all outperformed on multiple metrics.
- Abstract(参考訳): オブジェクトが知られているか、新しいかを認識する人間の能力は、現在、すべてのオープンセット認識アルゴリズムを上回っている。
心理学からの視覚心理物理学の手法と手順によって測定される人間の知覚は、コンピュータビジョンにおける視覚認識タスクの新規性を管理する追加のデータストリームを提供することができる。
例えば、ヒトの被験者から測定された反応時間は、既知のクラスサンプルが新しいサンプルと混同されるかどうかについての洞察を与えることができる。
本研究では,物体認識に関連する20万以上の反応時間測定を収集した大規模行動実験を考案し,実施した。
抽出された反応時間は、サンプルレベルでの物体間で有意義に変化する。
そこで我々は,異なる画像に対して異なる反応時間を示す深層ネットワークにおいて,人間の行動と整合性を示す新しい精神物理学的損失関数を設計した。
バイオビジョンと同様に、このアプローチはラベル付きトレーニングデータに制限のあるレジームにおいて、優れたオープンセット認識性能を達成することができる。
ImageNetのデータを用いた実験により、この新定式化によるマルチスケールDenseNetsのトレーニングにおいて、損失関数でトレーニングされたモデルでは、既知のサンプルにおけるトップ1テスト精度が7%向上し、未知サンプルにおけるトップ1テスト精度が33%向上した。
提案手法を文献から10個のオープンセット認識手法と比較し,複数の指標で比較した。
関連論文リスト
- Benchmarking Algorithmic Bias in Face Recognition: An Experimental
Approach Using Synthetic Faces and Human Evaluation [24.35436087740559]
顔認識システムにおけるバイアスを測定する実験手法を提案する。
本手法は,ニューラルフェイスジェネレータを用いて合成顔を生成する。
我々は3つの研究グレードの顔認識モデルの人種と性別の偏りを定量的に評価する。
論文 参考訳(メタデータ) (2023-08-10T08:57:31Z) - Multi-Dimensional Ability Diagnosis for Machine Learning Algorithms [88.93372675846123]
本稿では,機械学習アルゴリズム評価のためのタスク非依存評価フレームワークCamillaを提案する。
認識診断の仮定とニューラルネットワークを用いて、各サンプルのアルゴリズム、サンプル、スキル間の複雑な相互作用を学習する。
我々の実験では、カミラはメートル法信頼性、ランクの整合性、ランクの安定性で最先端のベースラインを上回ります。
論文 参考訳(メタデータ) (2023-07-14T03:15:56Z) - Advancing 3D finger knuckle recognition via deep feature learning [51.871256510747465]
接触のない3Dフィンガーナックルパターンは、識別性、距離からの視認性、利便性、利便性により、効果的な生体認証として出現している。
近年、ディープニューラルネットワークの中間機能を複数のスケールで同時に組み込むディープ・フィーチャー・コラボレーティブ・ネットワークが開発されている。
本稿では,3次元指のナックル画像を表現するために,最小次元の識別特徴ベクトルを学習する可能性を検討することにより,本手法を推し進める。
論文 参考訳(メタデータ) (2023-01-07T20:55:16Z) - A high performance fingerprint liveness detection method based on
quality related features [66.41574316136379]
このシステムは、10,500枚以上の実画像と偽画像からなる非常に難しいデータベースでテストされている。
提案手法はマルチシナリオデータセットに対して堅牢であることが証明され、全体の90%が正しく分類されたサンプルである。
論文 参考訳(メタデータ) (2021-11-02T21:09:39Z) - Passive attention in artificial neural networks predicts human visual
selectivity [8.50463394182796]
受動的注意法は人間の視覚的選択性の推定と大きく重なることを示す。
認識実験を用いて,これらの相関関係を因果操作で検証した。
この研究は、人間の視覚のモデルとして、主要なANNの生物学的および心理的妥当性を評価するための新しいアプローチに寄与する。
論文 参考訳(メタデータ) (2021-07-14T21:21:48Z) - Progressive Spatio-Temporal Bilinear Network with Monte Carlo Dropout
for Landmark-based Facial Expression Recognition with Uncertainty Estimation [93.73198973454944]
提案手法の性能は, 広く使用されている3つのデータセットで評価される。
ビデオベースの最先端の手法に匹敵するが、複雑さははるかに少ない。
論文 参考訳(メタデータ) (2021-06-08T13:40:30Z) - Eye Know You: Metric Learning for End-to-end Biometric Authentication
Using Eye Movements from a Longitudinal Dataset [4.511561231517167]
本稿では,ユーザの眼球運動を認証するための畳み込みニューラルネットワークを提案する。
ネットワークは、確立されたメトリック学習損失関数、多相性損失で訓練される。
目の動きは、3年後のテンプレートの老化に対して非常に弾力性があります。
論文 参考訳(メタデータ) (2021-04-21T12:21:28Z) - Face Forensics in the Wild [121.23154918448618]
我々は、ffiw-10kと呼ばれる新しい大規模データセットを構築し、高品質の偽造ビデオ1万本を含む。
操作手順は完全自動で、ドメイン対逆品質評価ネットワークによって制御されます。
さらに,多人数顔偽造検出の課題に取り組むための新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-30T05:06:19Z) - Learning Realistic Patterns from Unrealistic Stimuli: Generalization and
Data Anonymization [0.5091527753265949]
本研究は、匿名化されたデータ合成において、サードパーティがそのようなプライベートデータから恩恵を受けられるような、シンプルかつ非従来的なアプローチについて検討する。
オープンおよび大規模臨床研究の睡眠モニタリングデータを用いて,(1)エンドユーザーが睡眠時無呼吸検出のためにカスタマイズされた分類モデルを作成し,有効活用できるかどうかを評価し,(2)研究参加者の身元を保護した。
論文 参考訳(メタデータ) (2020-09-21T16:31:21Z) - Real-Time Face and Landmark Localization for Eyeblink Detection [1.617280000789628]
顔と目印検出アルゴリズムを慎重に組み合わせて、完全に自動化された視線追跡を実現している。
実験により,1フレームあたり0.533ミリ秒の全体ランタイム応用が明らかになった。
これは、シーケンシャルな実装よりも高速で、1,101$times$である。
論文 参考訳(メタデータ) (2020-06-01T09:46:25Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。