論文の概要: Double Trouble? Impact and Detection of Duplicates in Face Image
Datasets
- arxiv url: http://arxiv.org/abs/2401.14088v1
- Date: Thu, 25 Jan 2024 11:10:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-26 14:56:57.547068
- Title: Double Trouble? Impact and Detection of Duplicates in Face Image
Datasets
- Title(参考訳): ダブルトラブル?
顔画像データセットにおける重複の影響と検出
- Authors: Torsten Schlett, Christian Rathgeb, Juan Tapia, Christoph Busch
- Abstract要約: 顔のバイオメトリックス研究を目的とした顔画像データセットは、Webスクラッピングによって作成されている。
この研究は、顔画像とほぼ同一の顔画像の両方を正確に検出するアプローチを示す。
- 参考スコア(独自算出の注目度): 7.092869001331781
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Various face image datasets intended for facial biometrics research were
created via web-scraping, i.e. the collection of images publicly available on
the internet. This work presents an approach to detect both exactly and nearly
identical face image duplicates, using file and image hashes. The approach is
extended through the use of face image preprocessing. Additional steps based on
face recognition and face image quality assessment models reduce false
positives, and facilitate the deduplication of the face images both for intra-
and inter-subject duplicate sets. The presented approach is applied to five
datasets, namely LFW, TinyFace, Adience, CASIA-WebFace, and C-MS-Celeb (a
cleaned MS-Celeb-1M variant). Duplicates are detected within every dataset,
with hundreds to hundreds of thousands of duplicates for all except LFW. Face
recognition and quality assessment experiments indicate a minor impact on the
results through the duplicate removal. The final deduplication data is publicly
available.
- Abstract(参考訳): 顔のバイオメトリックス研究を目的とした様々な顔画像データセットは、ウェブスクラッピング(インターネット上で公開されている画像の収集)によって作成された。
この研究は、ファイルと画像ハッシュを用いて、正確にもほぼ同一の顔画像の重複を検出するアプローチを示す。
アプローチは、顔画像前処理を使用して拡張される。
顔認識と顔画像品質評価モデルに基づく追加ステップにより、偽陽性が減少し、サブジェクト内およびサブジェクト間重複集合の両方で顔画像の重複が緩和される。
本手法は,lfw,tinyface,adience,casia-webface,c-ms-celebの5つのデータセットに適用した。
重複はデータセット毎に検出され、LFWを除いて数百から数十万の重複がある。
顔認識と品質評価実験は、重複除去による結果への小さな影響を示している。
最後の重複データが公開されている。
関連論文リスト
- Effective Adapter for Face Recognition in the Wild [77.09252386558362]
私たちは、画像が低品質で現実世界の歪みに悩まされる、野生の顔認識の課題に取り組みます。
従来のアプローチでは、劣化した画像や、顔の復元技術を使って強化された画像を直接訓練するが、効果がないことが証明された。
高品質な顔データセットで訓練された既存の顔認識モデルを強化するための効果的なアダプタを提案する。
論文 参考訳(メタデータ) (2023-12-04T08:55:46Z) - FACE-AUDITOR: Data Auditing in Facial Recognition Systems [24.082527732931677]
顔画像を扱うスケーラビリティと能力のために、ショットベースの顔認識システムが注目されている。
顔画像の誤使用を防止するために、簡単なアプローチとして、生の顔画像を共有する前に修正する方法がある。
そこで本研究では,FACE-AUDITORの完全ツールキットを提案する。このツールキットは,少数ショットベースの顔認識モデルに問い合わせ,ユーザの顔画像のいずれかがモデルのトレーニングに使用されているかどうかを判断する。
論文 参考訳(メタデータ) (2023-04-05T23:03:54Z) - FaceMAE: Privacy-Preserving Face Recognition via Masked Autoencoders [81.21440457805932]
顔のプライバシと認識性能を同時に考慮する新しいフレームワークFaceMAEを提案する。
ランダムにマスクされた顔画像は、FaceMAEの再構築モジュールのトレーニングに使用される。
また、いくつかの公開顔データセット上で十分なプライバシー保護顔認証を行う。
論文 参考訳(メタデータ) (2022-05-23T07:19:42Z) - Reliable Detection of Doppelg\"angers based on Deep Face Representations [14.832145647643848]
The Wild データベースにおける Dppelg "anger" が HDA Doppelg "anger and Disguised Faces に与える影響を評価する。
doppelg "anger image pairs は非常に高い類似点が得られ、結果として偽の一致率が著しく増加することが判明した。
交配比較試験からドッペルグ・アンガーを識別するドッペルグ・アンガー検出法を提案する。
論文 参考訳(メタデータ) (2022-01-21T18:37:08Z) - FaceOcc: A Diverse, High-quality Face Occlusion Dataset for Human Face
Extraction [3.8502825594372703]
隠蔽は野生の顔画像にしばしば発生し、ランドマーク検出や3D再構成、顔認識といった顔関連の課題に悩まされる。
本稿では,CelebA本社とインターネットから手動で顔の隠蔽をラベル付けした新しい顔のセグメンテーションデータセットを提案する。
簡単な顔分割モデルの訓練を行ったが,SOTA性能が得られ,提案したデータセットの有効性を実証した。
論文 参考訳(メタデータ) (2022-01-20T19:44:18Z) - End2End Occluded Face Recognition by Masking Corrupted Features [82.27588990277192]
最先端の一般的な顔認識モデルは、隠蔽された顔画像に対してうまく一般化しない。
本稿では,1つのエンドツーエンドのディープニューラルネットワークに基づいて,オクルージョンに頑健な新しい顔認識手法を提案する。
我々のアプローチは、深い畳み込みニューラルネットワークから破損した特徴を発見し、動的に学習されたマスクによってそれらをきれいにする。
論文 参考訳(メタデータ) (2021-08-21T09:08:41Z) - SynFace: Face Recognition with Synthetic Data [83.15838126703719]
我々は、ID混在(IM)とドメイン混在(DM)を併用したSynFaceを考案し、パフォーマンスギャップを緩和する。
また、合成顔画像の系統的実験分析を行い、合成データを顔認識に効果的に活用する方法についての知見を提供する。
論文 参考訳(メタデータ) (2021-08-18T03:41:54Z) - A Study of Face Obfuscation in ImageNet [94.2949777826947]
本稿では,imagenetチャレンジにおける画像難読化について検討する。
ImageNetチャレンジのほとんどのカテゴリは、人のカテゴリではありません。
さまざまな深層ニューラルネットワークを顔画像上でベンチマークし、異なるカテゴリに対する異なる影響を観察します。
結果は、顔が破れた画像で学んだ特徴が等しく転送可能であることを示している。
論文 参考訳(メタデータ) (2021-03-10T17:11:34Z) - When Face Recognition Meets Occlusion: A New Benchmark [37.616211206620854]
擬似閉塞顔認識データセットを作成します。
対象は10,575人の顔画像804,704枚。
私たちのデータセットは最先端のものを大幅に上回ります。
論文 参考訳(メタデータ) (2021-03-04T03:07:42Z) - A Method for Curation of Web-Scraped Face Image Datasets [13.893682217746816]
データセットを集める際には、さまざまな問題が発生する。
何百万もの画像が存在しているため、手作業によるクリーニングは不可能である。
本稿では,顔認識手法をテストするためのクリーンなデータセットを提供することを目標とする半自動手法を提案する。
論文 参考訳(メタデータ) (2020-04-07T01:57:32Z) - Joint Deep Learning of Facial Expression Synthesis and Recognition [97.19528464266824]
顔表情の合成と認識を効果的に行うための新しい統合深層学習法を提案する。
提案手法は, 2段階の学習手順を伴い, まず, 表情の異なる顔画像を生成するために, 表情合成生成対向ネットワーク (FESGAN) を事前訓練する。
実画像と合成画像間のデータバイアスの問題を軽減するために,新しい実データ誘導バックプロパゲーション(RDBP)アルゴリズムを用いたクラス内損失を提案する。
論文 参考訳(メタデータ) (2020-02-06T10:56:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。