論文の概要: Double Trouble? Impact and Detection of Duplicates in Face Image
Datasets
- arxiv url: http://arxiv.org/abs/2401.14088v1
- Date: Thu, 25 Jan 2024 11:10:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-26 14:56:57.547068
- Title: Double Trouble? Impact and Detection of Duplicates in Face Image
Datasets
- Title(参考訳): ダブルトラブル?
顔画像データセットにおける重複の影響と検出
- Authors: Torsten Schlett, Christian Rathgeb, Juan Tapia, Christoph Busch
- Abstract要約: 顔のバイオメトリックス研究を目的とした顔画像データセットは、Webスクラッピングによって作成されている。
この研究は、顔画像とほぼ同一の顔画像の両方を正確に検出するアプローチを示す。
- 参考スコア(独自算出の注目度): 7.092869001331781
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Various face image datasets intended for facial biometrics research were
created via web-scraping, i.e. the collection of images publicly available on
the internet. This work presents an approach to detect both exactly and nearly
identical face image duplicates, using file and image hashes. The approach is
extended through the use of face image preprocessing. Additional steps based on
face recognition and face image quality assessment models reduce false
positives, and facilitate the deduplication of the face images both for intra-
and inter-subject duplicate sets. The presented approach is applied to five
datasets, namely LFW, TinyFace, Adience, CASIA-WebFace, and C-MS-Celeb (a
cleaned MS-Celeb-1M variant). Duplicates are detected within every dataset,
with hundreds to hundreds of thousands of duplicates for all except LFW. Face
recognition and quality assessment experiments indicate a minor impact on the
results through the duplicate removal. The final deduplication data is publicly
available.
- Abstract(参考訳): 顔のバイオメトリックス研究を目的とした様々な顔画像データセットは、ウェブスクラッピング(インターネット上で公開されている画像の収集)によって作成された。
この研究は、ファイルと画像ハッシュを用いて、正確にもほぼ同一の顔画像の重複を検出するアプローチを示す。
アプローチは、顔画像前処理を使用して拡張される。
顔認識と顔画像品質評価モデルに基づく追加ステップにより、偽陽性が減少し、サブジェクト内およびサブジェクト間重複集合の両方で顔画像の重複が緩和される。
本手法は,lfw,tinyface,adience,casia-webface,c-ms-celebの5つのデータセットに適用した。
重複はデータセット毎に検出され、LFWを除いて数百から数十万の重複がある。
顔認識と品質評価実験は、重複除去による結果への小さな影響を示している。
最後の重複データが公開されている。
関連論文リスト
- OSDFace: One-Step Diffusion Model for Face Restoration [72.5045389847792]
拡散モデルは、顔の修復において顕著な性能を示した。
顔復元のための新しいワンステップ拡散モデルOSDFaceを提案する。
その結果,OSDFaceは現状のSOTA(State-of-the-art)手法を視覚的品質と定量的指標の両方で上回っていることがわかった。
論文 参考訳(メタデータ) (2024-11-26T07:07:48Z) - LightFFDNets: Lightweight Convolutional Neural Networks for Rapid Facial Forgery Detection [0.0]
本研究では,Fake-Vs-Real-Faces [10]と140k Real and Fake Faces [61]データセットを用いた画像処理による偽造検出に焦点を当てた。
これらの画像を用いて偽造検出を行うために,2つの軽量ディープラーニングモデルを提案する。
提案した軽量ディープラーニングモデルは,顔画像の偽造を正確に,かつ効率的に検出できることが示されている。
論文 参考訳(メタデータ) (2024-11-18T18:44:10Z) - Semantic Contextualization of Face Forgery: A New Definition, Dataset, and Detection Method [77.65459419417533]
我々は,顔フォージェリを意味的文脈に配置し,意味的顔属性を変更する計算手法が顔フォージェリの源であることを定義した。
階層的なグラフで整理されたラベルの集合に各画像が関連付けられている大規模な顔偽画像データセットを構築した。
本稿では,ラベル関係を捕捉し,その優先課題を優先するセマンティクス指向の顔偽造検出手法を提案する。
論文 参考訳(メタデータ) (2024-05-14T10:24:19Z) - DiffusionFace: Towards a Comprehensive Dataset for Diffusion-Based Face Forgery Analysis [71.40724659748787]
DiffusionFaceは、最初の拡散ベースのフェイスフォージェリーデータセットである。
非条件およびテキストガイドの顔画像生成、Img2Img、Inpaint、Diffusionベースの顔交換アルゴリズムなど、さまざまなフォージェリーカテゴリをカバーする。
重要なメタデータと、評価のための実世界のインターネットソースの偽顔画像データセットを提供する。
論文 参考訳(メタデータ) (2024-03-27T11:32:44Z) - Arc2Face: A Foundation Model for ID-Consistent Human Faces [95.00331107591859]
Arc2Faceは、ID条件のフェイスファンデーションモデルである。
既存のモデルと無矛盾の顔類似度で、多様なフォトリアリスティック画像を生成することができる。
論文 参考訳(メタデータ) (2024-03-18T10:32:51Z) - FACE-AUDITOR: Data Auditing in Facial Recognition Systems [24.082527732931677]
顔画像を扱うスケーラビリティと能力のために、ショットベースの顔認識システムが注目されている。
顔画像の誤使用を防止するために、簡単なアプローチとして、生の顔画像を共有する前に修正する方法がある。
そこで本研究では,FACE-AUDITORの完全ツールキットを提案する。このツールキットは,少数ショットベースの顔認識モデルに問い合わせ,ユーザの顔画像のいずれかがモデルのトレーニングに使用されているかどうかを判断する。
論文 参考訳(メタデータ) (2023-04-05T23:03:54Z) - FaceMAE: Privacy-Preserving Face Recognition via Masked Autoencoders [81.21440457805932]
顔のプライバシと認識性能を同時に考慮する新しいフレームワークFaceMAEを提案する。
ランダムにマスクされた顔画像は、FaceMAEの再構築モジュールのトレーニングに使用される。
また、いくつかの公開顔データセット上で十分なプライバシー保護顔認証を行う。
論文 参考訳(メタデータ) (2022-05-23T07:19:42Z) - Reliable Detection of Doppelg\"angers based on Deep Face Representations [14.832145647643848]
The Wild データベースにおける Dppelg "anger" が HDA Doppelg "anger and Disguised Faces に与える影響を評価する。
doppelg "anger image pairs は非常に高い類似点が得られ、結果として偽の一致率が著しく増加することが判明した。
交配比較試験からドッペルグ・アンガーを識別するドッペルグ・アンガー検出法を提案する。
論文 参考訳(メタデータ) (2022-01-21T18:37:08Z) - End2End Occluded Face Recognition by Masking Corrupted Features [82.27588990277192]
最先端の一般的な顔認識モデルは、隠蔽された顔画像に対してうまく一般化しない。
本稿では,1つのエンドツーエンドのディープニューラルネットワークに基づいて,オクルージョンに頑健な新しい顔認識手法を提案する。
我々のアプローチは、深い畳み込みニューラルネットワークから破損した特徴を発見し、動的に学習されたマスクによってそれらをきれいにする。
論文 参考訳(メタデータ) (2021-08-21T09:08:41Z) - When Face Recognition Meets Occlusion: A New Benchmark [37.616211206620854]
擬似閉塞顔認識データセットを作成します。
対象は10,575人の顔画像804,704枚。
私たちのデータセットは最先端のものを大幅に上回ります。
論文 参考訳(メタデータ) (2021-03-04T03:07:42Z) - A Method for Curation of Web-Scraped Face Image Datasets [13.893682217746816]
データセットを集める際には、さまざまな問題が発生する。
何百万もの画像が存在しているため、手作業によるクリーニングは不可能である。
本稿では,顔認識手法をテストするためのクリーンなデータセットを提供することを目標とする半自動手法を提案する。
論文 参考訳(メタデータ) (2020-04-07T01:57:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。