論文の概要: Multi-Task Faces (MTF) Data Set: A Legally and Ethically Compliant Collection of Face Images for Various Classification Tasks
- arxiv url: http://arxiv.org/abs/2311.11882v2
- Date: Tue, 08 Apr 2025 13:38:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-09 13:27:00.374478
- Title: Multi-Task Faces (MTF) Data Set: A Legally and Ethically Compliant Collection of Face Images for Various Classification Tasks
- Title(参考訳): Multi-Task Faces (MTF) データセット: 様々な分類課題に対する法的かつ倫理的に整合した顔画像の収集
- Authors: Rami Haffar, David Sánchez, Josep Domingo-Ferrer,
- Abstract要約: 我々は、人種、性別、年齢による顔認識や分類など、様々なタスクのために設計されたマルチタスク・フェイス(MTF)データセットを紹介する。
MTFデータセットには、640人の画像132,816枚を含む非キュレートセットと240人の画像5,246枚を手作業でキュレートしたセットの2つのバージョンがある。
どちらのデータセットもソースとして公開されており、著作権規則に完全に準拠した有名人画像が公開されている。
- 参考スコア(独自算出の注目度): 3.5502600490147196
- License:
- Abstract: Human facial data offers valuable potential for tackling classification problems, including face recognition, age estimation, gender identification, emotion analysis, and race classification. However, recent privacy regulations, particularly the EU General Data Protection Regulation, have restricted the collection and usage of human images in research. As a result, several previously published face data sets have been removed from the internet due to inadequate data collection methods and privacy concerns. While synthetic data sets have been suggested as an alternative, they fall short of accurately representing the real data distribution. Additionally, most existing data sets are labeled for just a single task, which limits their versatility. To address these limitations, we introduce the Multi-Task Face (MTF) data set, designed for various tasks, including face recognition and classification by race, gender, and age, as well as for aiding in training generative networks. The MTF data set comes in two versions: a non-curated set containing 132,816 images of 640 individuals and a manually curated set with 5,246 images of 240 individuals, meticulously selected to maximize their classification quality. Both data sets were ethically sourced, using publicly available celebrity images in full compliance with copyright regulations. Along with providing detailed descriptions of data collection and processing, we evaluated the effectiveness of the MTF data set in training five deep learning models across the aforementioned classification tasks, achieving up to 98.88\% accuracy for gender classification, 95.77\% for race classification, 97.60\% for age classification, and 79.87\% for face recognition with the ConvNeXT model. Both MTF data sets can be accessed through the following link. https://github.com/RamiHaf/MTF_data_set
- Abstract(参考訳): 人間の顔データは、顔認識、年齢推定、性別識別、感情分析、人種分類など、分類問題に対処するための貴重な可能性を提供する。
しかし、最近のプライバシー規制、特にEU一般データ保護規則は、研究における人間の画像の収集と使用を制限している。
その結果、不適切なデータ収集方法やプライバシー上の懸念により、以前に公開されたいくつかの顔データセットがインターネットから削除された。
合成データセットは代替として提案されているが、実際のデータ分布を正確に表現できない。
さらに、既存のデータセットのほとんどは単一のタスクにラベル付けされているため、その汎用性は制限される。
これらの制約に対処するために、人種、性別、年齢による顔認識や分類、生成ネットワークのトレーニング支援など、様々なタスクのために設計されたマルチタスク・フェイス(MTF)データセットを導入する。
MTFデータセットには、640人の画像132,816枚を含む非キュレートセットと240人の画像5,246枚を手作業でキュレートしたセットの2つのバージョンがある。
どちらのデータセットも倫理的に源泉となり、著作権規則に完全に準拠する形で公開されている有名人画像を使用していた。
データ収集と処理の詳細な説明とともに、上記5つの深層学習モデルの学習におけるMCFデータセットの有効性を評価し、性別分類の精度98.88倍、人種分類の精度95.77倍、年齢分類の97.60倍、ConvNeXTモデルによる顔認識の79.87倍を達成した。
両方のMTFデータセットは、以下のリンクを通じてアクセスすることができる。
https://github.com/RamiHaf/MTF_data_set
関連論文リスト
- Human Body Restoration with One-Step Diffusion Model and A New Benchmark [74.66514054623669]
本稿では,高品質な自動収穫・フィルタリング(HQ-ACF)パイプラインを提案する。
このパイプラインは、既存のオブジェクト検出データセットやその他のラベル付けされていないイメージを活用して、高品質な人間の画像を自動的にトリミングし、フィルタリングする。
また,人体修復のための新しい1段階拡散モデルであるemphOSDHumanを提案する。
論文 参考訳(メタデータ) (2025-02-03T14:48:40Z) - DataDream: Few-shot Guided Dataset Generation [90.09164461462365]
実データ分布をより忠実に表現する分類データセットを合成するためのフレームワークを提案する。
DataDream fine-tunes LoRA weights for the image generation model on the few real image before generated the training data using the adapt model。
次に、合成データを用いてCLIPのLoRA重みを微調整し、様々なデータセットに対する以前のアプローチよりも下流画像の分類を改善する。
論文 参考訳(メタデータ) (2024-07-15T17:10:31Z) - SDFD: Building a Versatile Synthetic Face Image Dataset with Diverse Attributes [14.966767182001755]
顔の多様性の幅広いスペクトルをキャプチャする合成顔画像データセットを生成する手法を提案する。
具体的には、我々のアプローチは人口統計学とバイオメトリックスを統合するだけでなく、メイクアップ、ヘアスタイル、アクセサリーといった非永続的な特徴も統合しています。
これらのプロンプトは、高品質なリアル画像の包括的なデータセットを生成する際に、最先端のテキスト・ツー・イメージモデルを導く。
論文 参考訳(メタデータ) (2024-04-26T08:51:31Z) - DiffusionFace: Towards a Comprehensive Dataset for Diffusion-Based Face Forgery Analysis [71.40724659748787]
DiffusionFaceは、最初の拡散ベースのフェイスフォージェリーデータセットである。
非条件およびテキストガイドの顔画像生成、Img2Img、Inpaint、Diffusionベースの顔交換アルゴリズムなど、さまざまなフォージェリーカテゴリをカバーする。
重要なメタデータと、評価のための実世界のインターネットソースの偽顔画像データセットを提供する。
論文 参考訳(メタデータ) (2024-03-27T11:32:44Z) - Disguise without Disruption: Utility-Preserving Face De-Identification [40.484745636190034]
本研究では,修正データの利用性を確保しつつ,顔画像をシームレスに識別する新しいアルゴリズムであるDisguiseを紹介する。
本手法は, 難読化と非可逆性を最大化するために, 変分機構を用いて生成した合成物を用いて, 描写されたアイデンティティを抽出し置換することを含む。
提案手法を複数のデータセットを用いて広範に評価し,様々な下流タスクにおける従来の手法と比較して,高い非識別率と一貫性を示す。
論文 参考訳(メタデータ) (2023-03-23T13:50:46Z) - ConfounderGAN: Protecting Image Data Privacy with Causal Confounder [85.6757153033139]
本稿では,GAN(Generative Adversarial Network)のConfounderGANを提案する。
実験は、3つの自然なオブジェクトデータセットと3つの医療データセットからなる6つの画像分類データセットで実施される。
論文 参考訳(メタデータ) (2022-12-04T08:49:14Z) - Assessing Demographic Bias Transfer from Dataset to Model: A Case Study
in Facial Expression Recognition [1.5340540198612824]
2つのメトリクスはデータセットの表現バイアスとステレオタイプバイアスに焦点をあて、もう1つはトレーニングされたモデルの残差バイアスに焦点を当てている。
本稿では、一般的なAffectnetデータセットに基づくFER問題に適用することで、メトリクスの有用性を示す。
論文 参考訳(メタデータ) (2022-05-20T09:40:42Z) - EDFace-Celeb-1M: Benchmarking Face Hallucination with a Million-scale
Dataset [92.537021496096]
近年の深層顔の幻覚法は,超解像性難分解性顔画像において顕著な性能を示した。
したがって、これらのアルゴリズムが公衆の顔の幻覚データセット上でどのように機能するかは不明である。
本稿では,Ethnically Diverse Face データセット EDFace-Celeb-1M を構築し,顔幻覚のためのベンチマークタスクを設計する。
論文 参考訳(メタデータ) (2021-10-11T06:53:24Z) - Personalized Image Semantic Segmentation [58.980245748434]
ラベルのないパーソナライズされた画像に対して、データのパーソナライズされた特徴を調査することにより、より正確なセグメンテーション結果を生成する。
画像のセグメント化時に画像間コンテキストを組み込んだベースライン手法を提案する。
コードとPSSデータセットは公開されます。
論文 参考訳(メタデータ) (2021-07-24T04:03:11Z) - Reducing bias and increasing utility by federated generative modeling of
medical images using a centralized adversary [10.809871958865447]
共同学習を可能にする生成メカニズムであるFELICIA(Federated LearnIng with a CentralIzed Adversary)を紹介します。
限定的かつ偏りのあるデータを持つデータ所有者が、すべてのソースからのデータをプライベートに保ちながら、他のデータ所有者の利益を享受する方法を示します。
これは、プライバシー法がデータをローカルな施設外で共有することを防ぐ医療画像解析において一般的なシナリオである。
論文 参考訳(メタデータ) (2021-01-18T18:40:46Z) - A Method for Curation of Web-Scraped Face Image Datasets [13.893682217746816]
データセットを集める際には、さまざまな問題が発生する。
何百万もの画像が存在しているため、手作業によるクリーニングは不可能である。
本稿では,顔認識手法をテストするためのクリーンなデータセットを提供することを目標とする半自動手法を提案する。
論文 参考訳(メタデータ) (2020-04-07T01:57:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。