論文の概要: Multi-Task Faces (MTF) Data Set: A Legally and Ethically Compliant Collection of Face Images for Various Classification Tasks
- arxiv url: http://arxiv.org/abs/2311.11882v2
- Date: Tue, 08 Apr 2025 13:38:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-18 05:34:12.149185
- Title: Multi-Task Faces (MTF) Data Set: A Legally and Ethically Compliant Collection of Face Images for Various Classification Tasks
- Title(参考訳): Multi-Task Faces (MTF) データセット: 様々な分類課題に対する法的かつ倫理的に整合した顔画像の収集
- Authors: Rami Haffar, David Sánchez, Josep Domingo-Ferrer,
- Abstract要約: 我々は、人種、性別、年齢による顔認識や分類など、様々なタスクのために設計されたマルチタスク・フェイス(MTF)データセットを紹介する。
MTFデータセットには、640人の画像132,816枚を含む非キュレートセットと240人の画像5,246枚を手作業でキュレートしたセットの2つのバージョンがある。
どちらのデータセットもソースとして公開されており、著作権規則に完全に準拠した有名人画像が公開されている。
- 参考スコア(独自算出の注目度): 3.5502600490147196
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human facial data offers valuable potential for tackling classification problems, including face recognition, age estimation, gender identification, emotion analysis, and race classification. However, recent privacy regulations, particularly the EU General Data Protection Regulation, have restricted the collection and usage of human images in research. As a result, several previously published face data sets have been removed from the internet due to inadequate data collection methods and privacy concerns. While synthetic data sets have been suggested as an alternative, they fall short of accurately representing the real data distribution. Additionally, most existing data sets are labeled for just a single task, which limits their versatility. To address these limitations, we introduce the Multi-Task Face (MTF) data set, designed for various tasks, including face recognition and classification by race, gender, and age, as well as for aiding in training generative networks. The MTF data set comes in two versions: a non-curated set containing 132,816 images of 640 individuals and a manually curated set with 5,246 images of 240 individuals, meticulously selected to maximize their classification quality. Both data sets were ethically sourced, using publicly available celebrity images in full compliance with copyright regulations. Along with providing detailed descriptions of data collection and processing, we evaluated the effectiveness of the MTF data set in training five deep learning models across the aforementioned classification tasks, achieving up to 98.88\% accuracy for gender classification, 95.77\% for race classification, 97.60\% for age classification, and 79.87\% for face recognition with the ConvNeXT model. Both MTF data sets can be accessed through the following link. https://github.com/RamiHaf/MTF_data_set
- Abstract(参考訳): 人間の顔データは、顔認識、年齢推定、性別識別、感情分析、人種分類など、分類問題に対処するための貴重な可能性を提供する。
しかし、最近のプライバシー規制、特にEU一般データ保護規則は、研究における人間の画像の収集と使用を制限している。
その結果、不適切なデータ収集方法やプライバシー上の懸念により、以前に公開されたいくつかの顔データセットがインターネットから削除された。
合成データセットは代替として提案されているが、実際のデータ分布を正確に表現できない。
さらに、既存のデータセットのほとんどは単一のタスクにラベル付けされているため、その汎用性は制限される。
これらの制約に対処するために、人種、性別、年齢による顔認識や分類、生成ネットワークのトレーニング支援など、様々なタスクのために設計されたマルチタスク・フェイス(MTF)データセットを導入する。
MTFデータセットには、640人の画像132,816枚を含む非キュレートセットと240人の画像5,246枚を手作業でキュレートしたセットの2つのバージョンがある。
どちらのデータセットも倫理的に源泉となり、著作権規則に完全に準拠する形で公開されている有名人画像を使用していた。
データ収集と処理の詳細な説明とともに、上記5つの深層学習モデルの学習におけるMCFデータセットの有効性を評価し、性別分類の精度98.88倍、人種分類の精度95.77倍、年齢分類の97.60倍、ConvNeXTモデルによる顔認識の79.87倍を達成した。
両方のMTFデータセットは、以下のリンクを通じてアクセスすることができる。
https://github.com/RamiHaf/MTF_data_set
関連論文リスト
- Human Body Restoration with One-Step Diffusion Model and A New Benchmark [74.66514054623669]
本稿では,高品質な自動収穫・フィルタリング(HQ-ACF)パイプラインを提案する。
このパイプラインは、既存のオブジェクト検出データセットやその他のラベル付けされていないイメージを活用して、高品質な人間の画像を自動的にトリミングし、フィルタリングする。
また,人体修復のための新しい1段階拡散モデルであるemphOSDHumanを提案する。
論文 参考訳(メタデータ) (2025-02-03T14:48:40Z) - DataDream: Few-shot Guided Dataset Generation [90.09164461462365]
実データ分布をより忠実に表現する分類データセットを合成するためのフレームワークを提案する。
DataDream fine-tunes LoRA weights for the image generation model on the few real image before generated the training data using the adapt model。
次に、合成データを用いてCLIPのLoRA重みを微調整し、様々なデータセットに対する以前のアプローチよりも下流画像の分類を改善する。
論文 参考訳(メタデータ) (2024-07-15T17:10:31Z) - SDFD: Building a Versatile Synthetic Face Image Dataset with Diverse Attributes [14.966767182001755]
顔の多様性の幅広いスペクトルをキャプチャする合成顔画像データセットを生成する手法を提案する。
具体的には、我々のアプローチは人口統計学とバイオメトリックスを統合するだけでなく、メイクアップ、ヘアスタイル、アクセサリーといった非永続的な特徴も統合しています。
これらのプロンプトは、高品質なリアル画像の包括的なデータセットを生成する際に、最先端のテキスト・ツー・イメージモデルを導く。
論文 参考訳(メタデータ) (2024-04-26T08:51:31Z) - DiffusionFace: Towards a Comprehensive Dataset for Diffusion-Based Face Forgery Analysis [71.40724659748787]
DiffusionFaceは、最初の拡散ベースのフェイスフォージェリーデータセットである。
非条件およびテキストガイドの顔画像生成、Img2Img、Inpaint、Diffusionベースの顔交換アルゴリズムなど、さまざまなフォージェリーカテゴリをカバーする。
重要なメタデータと、評価のための実世界のインターネットソースの偽顔画像データセットを提供する。
論文 参考訳(メタデータ) (2024-03-27T11:32:44Z) - Disguise without Disruption: Utility-Preserving Face De-Identification [40.484745636190034]
本研究では,修正データの利用性を確保しつつ,顔画像をシームレスに識別する新しいアルゴリズムであるDisguiseを紹介する。
本手法は, 難読化と非可逆性を最大化するために, 変分機構を用いて生成した合成物を用いて, 描写されたアイデンティティを抽出し置換することを含む。
提案手法を複数のデータセットを用いて広範に評価し,様々な下流タスクにおける従来の手法と比較して,高い非識別率と一貫性を示す。
論文 参考訳(メタデータ) (2023-03-23T13:50:46Z) - ConfounderGAN: Protecting Image Data Privacy with Causal Confounder [85.6757153033139]
本稿では,GAN(Generative Adversarial Network)のConfounderGANを提案する。
実験は、3つの自然なオブジェクトデータセットと3つの医療データセットからなる6つの画像分類データセットで実施される。
論文 参考訳(メタデータ) (2022-12-04T08:49:14Z) - A Masked Face Classification Benchmark on Low-Resolution Surveillance
Images [7.199382835973642]
Small Face MASK (SF-MASK) は、多種多様な異種データセットからエクスポートされた20kの低解像度画像からなるコレクションである。
特に、非常に高いカメラで撮影された顔は、顔の特徴が強く歪んでいるように見えるが、欠落している。
1701枚の画像の小さなサブサンプルには、ひどく摩耗したフェイスマスクが含まれており、マルチクラスの分類に挑戦している。
論文 参考訳(メタデータ) (2022-11-23T15:57:16Z) - How to Boost Face Recognition with StyleGAN? [13.067766076889995]
最先端の顔認識システムは大量のラベル付きトレーニングデータを必要とする。
業界における自己監督的革命は、関連する技術が顔認識に適応する研究を動機付けている。
StyleGANのための微調整pSpエンコーダに基づく簡単なアプローチにより、最先端の顔認識を改善することができることを示す。
論文 参考訳(メタデータ) (2022-10-18T18:41:56Z) - Assessing Demographic Bias Transfer from Dataset to Model: A Case Study
in Facial Expression Recognition [1.5340540198612824]
2つのメトリクスはデータセットの表現バイアスとステレオタイプバイアスに焦点をあて、もう1つはトレーニングされたモデルの残差バイアスに焦点を当てている。
本稿では、一般的なAffectnetデータセットに基づくFER問題に適用することで、メトリクスの有用性を示す。
論文 参考訳(メタデータ) (2022-05-20T09:40:42Z) - EDFace-Celeb-1M: Benchmarking Face Hallucination with a Million-scale
Dataset [92.537021496096]
近年の深層顔の幻覚法は,超解像性難分解性顔画像において顕著な性能を示した。
したがって、これらのアルゴリズムが公衆の顔の幻覚データセット上でどのように機能するかは不明である。
本稿では,Ethnically Diverse Face データセット EDFace-Celeb-1M を構築し,顔幻覚のためのベンチマークタスクを設計する。
論文 参考訳(メタデータ) (2021-10-11T06:53:24Z) - Inferring Offensiveness In Images From Natural Language Supervision [20.294073012815854]
ウェブから自動的に取り除かれた大規模な画像データセットには、カテゴリや攻撃的なイメージといった軽蔑的な用語が含まれる可能性がある。
我々は、事前学習されたトランスフォーマー自体が、大規模ビジョンデータセットの自動キュレーションのための方法論を提供することを示した。
論文 参考訳(メタデータ) (2021-10-08T16:19:21Z) - Personalized Image Semantic Segmentation [58.980245748434]
ラベルのないパーソナライズされた画像に対して、データのパーソナライズされた特徴を調査することにより、より正確なセグメンテーション結果を生成する。
画像のセグメント化時に画像間コンテキストを組み込んだベースライン手法を提案する。
コードとPSSデータセットは公開されます。
論文 参考訳(メタデータ) (2021-07-24T04:03:11Z) - Balancing Biases and Preserving Privacy on Balanced Faces in the Wild [50.915684171879036]
現在の顔認識(FR)モデルには、人口統計バイアスが存在する。
さまざまな民族と性別のサブグループにまたがる偏見を測定するために、我々のバランス・フェイススをWildデータセットに導入します。
真偽と偽のサンプルペアを区別するために1点のスコアしきい値に依存すると、最適以下の結果が得られます。
本稿では,最先端ニューラルネットワークから抽出した顔特徴を用いたドメイン適応学習手法を提案する。
論文 参考訳(メタデータ) (2021-03-16T15:05:49Z) - Reducing bias and increasing utility by federated generative modeling of
medical images using a centralized adversary [10.809871958865447]
共同学習を可能にする生成メカニズムであるFELICIA(Federated LearnIng with a CentralIzed Adversary)を紹介します。
限定的かつ偏りのあるデータを持つデータ所有者が、すべてのソースからのデータをプライベートに保ちながら、他のデータ所有者の利益を享受する方法を示します。
これは、プライバシー法がデータをローカルな施設外で共有することを防ぐ医療画像解析において一般的なシナリオである。
論文 参考訳(メタデータ) (2021-01-18T18:40:46Z) - Enhancing Facial Data Diversity with Style-based Face Aging [59.984134070735934]
特に、顔データセットは、通常、性別、年齢、人種などの属性の観点からバイアスされる。
本稿では, 細粒度の老化パターンをキャプチャするデータ拡張のための, 生成スタイルに基づく新しいアーキテクチャを提案する。
提案手法は, 年齢移動のための最先端アルゴリズムよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-06-06T21:53:44Z) - Investigating Bias in Deep Face Analysis: The KANFace Dataset and
Empirical Study [67.3961439193994]
現在までに最も包括的で大規模な顔画像とビデオのデータセットを導入している。
データは、アイデンティティ、正確な年齢、性別、親族関係の点で手動で注釈付けされる。
提案したベンチマークでネットワーク埋め込みをデバイアス化する手法を導入し,テストした。
論文 参考訳(メタデータ) (2020-05-15T00:14:39Z) - Boosting Semantic Human Matting with Coarse Annotations [66.8725980604434]
粗いアノテートされた人間のデータセットは、公開データセットから取得し、収集するのがずっと簡単です。
マットリファインメントネットワークは、統一マスクと入力画像とを取り込み、最終アルファマットを予測する。
論文 参考訳(メタデータ) (2020-04-10T09:11:02Z) - A Method for Curation of Web-Scraped Face Image Datasets [13.893682217746816]
データセットを集める際には、さまざまな問題が発生する。
何百万もの画像が存在しているため、手作業によるクリーニングは不可能である。
本稿では,顔認識手法をテストするためのクリーンなデータセットを提供することを目標とする半自動手法を提案する。
論文 参考訳(メタデータ) (2020-04-07T01:57:32Z) - PrivacyNet: Semi-Adversarial Networks for Multi-attribute Face Privacy [15.301150389512744]
画像手法を用いて, 顔画像に対するソフトバイオメトリック・プライバシを実現する手法を開発した。
画像摂動は、GANをベースとしたSAN(Semi-Adversarial Network)を用いて行われる。
PrivacyNetでは、入力された顔画像に難読化される属性を選択することができる。
論文 参考訳(メタデータ) (2020-01-02T18:53:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。