論文の概要: A Rapid Test for Accuracy and Bias of Face Recognition Technology
- arxiv url: http://arxiv.org/abs/2502.14996v1
- Date: Thu, 20 Feb 2025 19:38:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-24 16:10:54.181177
- Title: A Rapid Test for Accuracy and Bias of Face Recognition Technology
- Title(参考訳): 顔認識技術の精度とバイアスの迅速検証
- Authors: Manuel Knott, Ignacio Serna, Ethan Mann, Pietro Perona,
- Abstract要約: 本稿では,手動による注釈なしでFRシステムのベンチマークを行う1:1顔認証手法を提案する。
ラベルのクリーニングをトレーニングする従来の方法とは異なり、評価対象のモデルの埋め込み表現を活用する。
提案手法はFRの精度とランキングを確実に推定し,手動ラベリングの時間とコストを大幅に削減する。
- 参考スコア(独自算出の注目度): 16.008801104415692
- License:
- Abstract: Measuring the accuracy of face recognition (FR) systems is essential for improving performance and ensuring responsible use. Accuracy is typically estimated using large annotated datasets, which are costly and difficult to obtain. We propose a novel method for 1:1 face verification that benchmarks FR systems quickly and without manual annotation, starting from approximate labels (e.g., from web search results). Unlike previous methods for training set label cleaning, ours leverages the embedding representation of the models being evaluated, achieving high accuracy in smaller-sized test datasets. Our approach reliably estimates FR accuracy and ranking, significantly reducing the time and cost of manual labeling. We also introduce the first public benchmark of five FR cloud services, revealing demographic biases, particularly lower accuracy for Asian women. Our rapid test method can democratize FR testing, promoting scrutiny and responsible use of the technology. Our method is provided as a publicly accessible tool at https://github.com/caltechvisionlab/frt-rapid-test
- Abstract(参考訳): 顔認証システム(FR)の精度の測定は、性能の向上と責任ある使用の確保に不可欠である。
精度は通常、コストがかかり入手が困難である大規模な注釈付きデータセットを用いて推定される。
本稿では,1:1のフェース検証手法を提案する。この手法は,Web検索結果から,近似ラベルから始まる手動アノテーションを使わずに,FRシステムのベンチマークを迅速かつ迅速に行う。
ラベルのクリーニングをトレーニングする従来の方法とは異なり、評価対象のモデルの埋め込み表現を活用し、より小さなテストデータセットで高い精度を達成する。
提案手法はFRの精度とランキングを確実に推定し,手動ラベリングの時間とコストを大幅に削減する。
また、5つのFRクラウドサービスの最初の公開ベンチマークを導入し、人口統計バイアス、特にアジア女性の精度の低下を明らかにした。
我々の迅速なテスト手法はFRテストの民主化を図り、精査を促進し、その技術の責任を負う。
我々の方法はhttps://github.com/caltechvisionlab/frt-rapid-testで公開されているツールとして提供されている。
関連論文リスト
- A Systematic Review of Machine Learning Approaches for Detecting Deceptive Activities on Social Media: Methods, Challenges, and Biases [0.037693031068634524]
本稿では、機械学習(ML)モデルとディープラーニング(DL)モデルを用いて、ソーシャルメディア上の偽ニュース、スパム、偽アカウントを検出する研究を体系的に評価する。
論文 参考訳(メタデータ) (2024-10-26T23:55:50Z) - Are We Really Achieving Better Beyond-Accuracy Performance in Next Basket Recommendation? [57.91114305844153]
次のバスケットレコメンデーション(NBR)は、ますます注目を集めている特別なタイプのシーケンシャルレコメンデーションである。
NBRに関する最近の研究は、繰り返し項目を推奨することと項目を探索することの間に大きなパフォーマンス差が見つかった。
本稿では,繰り返しアイテムを扱い,個別にアイテムを探索する2段階反復探索フレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-02T09:59:35Z) - Take Care of Your Prompt Bias! Investigating and Mitigating Prompt Bias in Factual Knowledge Extraction [56.17020601803071]
近年の研究では、事前学習言語モデル(PLM)が、事実知識抽出において「急激なバイアス」に悩まされていることが示されている。
本稿では,突発バイアスを徹底的に調査し緩和することにより,既存のベンチマークの信頼性を向上させることを目的とする。
論文 参考訳(メタデータ) (2024-03-15T02:04:35Z) - DE$^3$-BERT: Distance-Enhanced Early Exiting for BERT based on
Prototypical Networks [43.967626080432275]
BERT(DE$3$-BERT)のための新しい遠隔拡張早期実行フレームワークを提案する。
我々は,古典的エントロピーに基づく地域情報と距離に基づくグローバル情報とを補完するハイブリッドエグジット戦略を実装した。
GLUEベンチマークの実験では、De$3$-BERTが最先端モデルより一貫して優れていることが示されている。
論文 参考訳(メタデータ) (2024-02-03T15:51:17Z) - Early Time Classification with Accumulated Accuracy Gap Control [34.77841988415891]
早期分類アルゴリズムは、完全な入力ストリームを処理することなく、機能のストリームをラベル付けすることを目的としている。
我々は,任意の逐次分類器に適用可能な統計フレームワークを導入し,校正停止規則を定式化する。
提案した早期停止機構は,厳密な精度のギャップ制御を達成しつつ,分類に使用される時間ステップの最大94%を削減できることを示す。
論文 参考訳(メタデータ) (2024-02-01T18:54:34Z) - Weak Supervision Performance Evaluation via Partial Identification [46.73061437177238]
Programmatic Weak Supervision (PWS) は、地上の真理ラベルに直接アクセスすることなく、教師付きモデルトレーニングを可能にする。
本稿では,モデル評価を部分的同定問題としてフレーミングすることで,この問題に対処する新しい手法を提案する。
提案手法は,従来の弱監督評価手法において,ラベル付きデータを必要とせず,重要な指標に信頼性のあるバウンダリを導出する。
論文 参考訳(メタデータ) (2023-12-07T07:15:11Z) - Model-free Test Time Adaptation for Out-Of-Distribution Detection [62.49795078366206]
我々はtextbfDistribution textbfDetection (abbr) のための非パラメトリックテスト時間 textbfAdaptation フレームワークを提案する。
Abbrは、オンラインテストサンプルを使用して、テスト中のモデル適応、データ分散の変更への適応性を向上させる。
複数のOOD検出ベンチマークにおける包括的実験により,abrの有効性を示す。
論文 参考訳(メタデータ) (2023-11-28T02:00:47Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Sample and Computation Redistribution for Efficient Face Detection [137.19388513633484]
トレーニングデータサンプリングと計算分布戦略は、効率的で正確な顔検出の鍵です。
scrfdf34は、最高の競合製品であるTinaFaceを3.86%(ハードセットでのAP)で上回り、GPU上でVGA解像度画像でmph3$times$より高速です。
論文 参考訳(メタデータ) (2021-05-10T23:51:14Z) - ALT-MAS: A Data-Efficient Framework for Active Testing of Machine
Learning Algorithms [58.684954492439424]
少量のラベル付きテストデータのみを用いて機械学習モデルを効率的にテストする新しいフレームワークを提案する。
ベイズニューラルネットワーク(bnn)を用いたモデルアンダーテストの関心指標の推定が目的である。
論文 参考訳(メタデータ) (2021-04-11T12:14:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。