論文の概要: Dataset Cleaning -- A Cross Validation Methodology for Large Facial
Datasets using Face Recognition
- arxiv url: http://arxiv.org/abs/2003.10815v1
- Date: Tue, 24 Mar 2020 13:01:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-20 09:35:25.500094
- Title: Dataset Cleaning -- A Cross Validation Methodology for Large Facial
Datasets using Face Recognition
- Title(参考訳): データセットクリーニング --顔認識を用いた大規模顔データセットのクロス検証手法
- Authors: Viktor Varkarakis, Peter Corcoran
- Abstract要約: 近年、顔検出、顔認識、その他のタスクの進歩を促進するために、大規模な「野生の」顔データセットがリリースされた。
これらのデータセットの収集方法が自動的であり、そのサイズが大きいため、多くのIDフォルダにはデータセットの品質を劣化させる間違ったラベル付きサンプルが含まれている。
本研究では,音声認識を用いて,ノイズの多い顔データセットを半自動で浄化する手法を提案する。
- 参考スコア(独自算出の注目度): 0.40611352512781856
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, large "in the wild" face datasets have been released in an
attempt to facilitate progress in tasks such as face detection, face
recognition, and other tasks. Most of these datasets are acquired from webpages
with automatic procedures. As a consequence, noisy data are often found.
Furthermore, in these large face datasets, the annotation of identities is
important as they are used for training face recognition algorithms. But due to
the automatic way of gathering these datasets and due to their large size, many
identities folder contain mislabeled samples which deteriorates the quality of
the datasets. In this work, it is presented a semi-automatic method for
cleaning the noisy large face datasets with the use of face recognition. This
methodology is applied to clean the CelebA dataset and show its effectiveness.
Furthermore, the list with the mislabelled samples in the CelebA dataset is
made available.
- Abstract(参考訳): 近年、顔検出、顔認識、その他のタスクの進歩を促進するために、大規模な「野生の」顔データセットがリリースされた。
これらのデータセットのほとんどは、自動手順でwebページから取得される。
その結果、ノイズの多いデータがしばしば見つかる。
さらに,これらの大規模顔データセットでは,顔認識アルゴリズムのトレーニングに使用されるため,アイデンティティのアノテーションが重要である。
しかし、これらのデータセットの自動収集方法と大きなサイズのため、多くのididityフォルダには、データセットの品質を低下させるラベル付きサンプルが含まれている。
そこで本研究では,雑音の多い大顔データセットを顔認証を用いて掃除する半自動的な手法を提案する。
この手法はCelebAデータセットをクリーニングし、その有効性を示す。
さらに、celebaデータセットのミスラベルされたサンプルのリストも利用可能である。
関連論文リスト
- Semantic Contextualization of Face Forgery: A New Definition, Dataset, and Detection Method [77.65459419417533]
我々は,顔フォージェリを意味的文脈に配置し,意味的顔属性を変更する計算手法が顔フォージェリの源であることを定義した。
階層的なグラフで整理されたラベルの集合に各画像が関連付けられている大規模な顔偽画像データセットを構築した。
本稿では,ラベル関係を捕捉し,その優先課題を優先するセマンティクス指向の顔偽造検出手法を提案する。
論文 参考訳(メタデータ) (2024-05-14T10:24:19Z) - DiffusionFace: Towards a Comprehensive Dataset for Diffusion-Based Face Forgery Analysis [71.40724659748787]
DiffusionFaceは、最初の拡散ベースのフェイスフォージェリーデータセットである。
非条件およびテキストガイドの顔画像生成、Img2Img、Inpaint、Diffusionベースの顔交換アルゴリズムなど、さまざまなフォージェリーカテゴリをカバーする。
重要なメタデータと、評価のための実世界のインターネットソースの偽顔画像データセットを提供する。
論文 参考訳(メタデータ) (2024-03-27T11:32:44Z) - Attribute-preserving Face Dataset Anonymization via Latent Code
Optimization [64.4569739006591]
本稿では,事前学習したGANの潜時空間における画像の潜時表現を直接最適化するタスク非依存匿名化手法を提案する。
我々は一連の実験を通して、我々の手法が画像の同一性を匿名化できる一方で、顔の属性をより保存できることを実証した。
論文 参考訳(メタデータ) (2023-03-20T17:34:05Z) - How to Boost Face Recognition with StyleGAN? [13.067766076889995]
最先端の顔認識システムは大量のラベル付きトレーニングデータを必要とする。
業界における自己監督的革命は、関連する技術が顔認識に適応する研究を動機付けている。
StyleGANのための微調整pSpエンコーダに基づく簡単なアプローチにより、最先端の顔認識を改善することができることを示す。
論文 参考訳(メタデータ) (2022-10-18T18:41:56Z) - FP-Age: Leveraging Face Parsing Attention for Facial Age Estimation in
the Wild [50.8865921538953]
年齢推定に顔のセマンティクスを明示的に組み込む手法を提案する。
我々は,顔解析に基づくネットワークを設計し,異なるスケールで意味情報を学習する。
提案手法は,既存の年齢推定手法を常に上回っていることを示す。
論文 参考訳(メタデータ) (2021-06-21T14:31:32Z) - How important are faces for person re-identification? [14.718372669984364]
顔検出およびぼかしアルゴリズムを適用し、複数の人気人物再識別データセットの匿名化バージョンを作成する。
我々は,この匿名化が標準メトリクスを用いた再識別性能に与える影響を評価する。
論文 参考訳(メタデータ) (2020-10-13T11:47:16Z) - Masked Face Recognition for Secure Authentication [2.429066522170765]
マスクされた顔は検出と認識が難しいため、社内データセットを無効にする恐れがある。
マスクされた顔の大規模なデータセットを効果的に作成するためのオープンソースのツールであるMaskTheFaceを提案する。
Facenet システムでは 38% の増加がみられた。
論文 参考訳(メタデータ) (2020-08-25T15:33:59Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z) - A Method for Curation of Web-Scraped Face Image Datasets [13.893682217746816]
データセットを集める際には、さまざまな問題が発生する。
何百万もの画像が存在しているため、手作業によるクリーニングは不可能である。
本稿では,顔認識手法をテストするためのクリーンなデータセットを提供することを目標とする半自動手法を提案する。
論文 参考訳(メタデータ) (2020-04-07T01:57:32Z) - Boosting Unconstrained Face Recognition with Auxiliary Unlabeled Data [59.85605718477639]
本稿では,ラベルのない顔を用いて一般化可能な顔表現を学習する手法を提案する。
制約のないデータセットに対する実験結果から、十分な多様性を持つ少量のラベル付きデータが認識性能を向上させる可能性が示唆された。
論文 参考訳(メタデータ) (2020-03-17T20:58:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。