論文の概要: Multi-Task Faces (MTF) Data Set: A Legally and Ethically Compliant
Collection of Face Images for Various Classification Tasks
- arxiv url: http://arxiv.org/abs/2311.11882v1
- Date: Mon, 20 Nov 2023 16:19:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-21 18:02:43.828208
- Title: Multi-Task Faces (MTF) Data Set: A Legally and Ethically Compliant
Collection of Face Images for Various Classification Tasks
- Title(参考訳): Multi-Task Faces (MTF) データセット: 様々な分類課題に対する法的かつ倫理的に整合した顔画像の収集
- Authors: Rami Haffar, David S\'anchez, and Josep Domingo-Ferrer
- Abstract要約: 最近のプライバシー規制は、人間の画像の収集と研究の方法を制限する。
人間の顔を含むいくつかのデータセットは、不十分なデータ収集方法のため、インターネットから削除されている。
本稿では,多面顔画像データセットであるMTF(Multi-Task Faces)について述べる。
- 参考スコア(独自算出の注目度): 3.1133049660590615
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human facial data hold tremendous potential to address a variety of
classification problems, including face recognition, age estimation, gender
identification, emotion analysis, and race classification. However, recent
privacy regulations, such as the EU General Data Protection Regulation and
others, have restricted the ways in which human images may be collected and
used for research. As a result, several previously published data sets
containing human faces have been removed from the internet due to inadequate
data collection methods that failed to meet privacy regulations. Data sets
consisting of synthetic data have been proposed as an alternative, but they
fall short of accurately representing the real data distribution. On the other
hand, most available data sets are labeled for just a single task, which limits
their applicability. To address these issues, we present the Multi-Task Faces
(MTF) image data set, a meticulously curated collection of face images designed
for various classification tasks, including face recognition, as well as race,
gender, and age classification. The MTF data set has been ethically gathered by
leveraging publicly available images of celebrities and strictly adhering to
copyright regulations. In this paper, we present this data set and provide
detailed descriptions of the followed data collection and processing
procedures. Furthermore, we evaluate the performance of five deep learning (DL)
models on the MTF data set across the aforementioned classification tasks.
Additionally, we compare the performance of DL models over the processed MTF
data and over raw data crawled from the internet. The reported results
constitute a baseline for further research employing these data. The MTF data
set can be accessed through the following link (please cite the present paper
if you use the data set): https://github.com/RamiHaf/MTF_data_set
- Abstract(参考訳): 人間の顔データは、顔認識、年齢推定、性別識別、感情分析、人種分類など、さまざまな分類問題に対処する大きな可能性を秘めている。
しかし、eu一般データ保護規則などの最近のプライバシー規制では、人間の画像が収集され、研究に利用される方法が制限されている。
その結果、プライバシー規制を満たさない不適切なデータ収集方法のために、人間の顔を含むいくつかのデータセットがインターネットから削除された。
合成データからなるデータセットは代替案として提案されているが、実際のデータ分布を正確に表現できない。
一方、ほとんどの利用可能なデータセットは単一のタスクのためにラベル付けされているため、適用性は制限される。
これらの問題に対処するため,我々は,顔認識や人種,性別,年齢分類など,さまざまな分類タスク用に設計された顔画像の集合であるmulti-task faces (mtf) 画像データセットを提案する。
MTFデータセットは、有名人の公開画像を活用し、著作権規制を厳格に遵守することで倫理的に収集されている。
本稿では,このデータセットとそれに続くデータ収集および処理手順の詳細について述べる。
さらに,上記の分類課題にまたがるMTFデータセット上での5つのディープラーニング(DL)モデルの性能評価を行った。
さらに,加工したMTFデータとインターネットからクロールした生データのDLモデルの性能を比較した。
報告された結果は、これらのデータを用いたさらなる研究のベースラインを構成する。
MTFデータセットは、以下のリンクを通じてアクセスすることができる(データセットを使用すると、この論文を引用する)。
関連論文リスト
- DataDream: Few-shot Guided Dataset Generation [90.09164461462365]
実データ分布をより忠実に表現する分類データセットを合成するためのフレームワークを提案する。
DataDream fine-tunes LoRA weights for the image generation model on the few real image before generated the training data using the adapt model。
次に、合成データを用いてCLIPのLoRA重みを微調整し、様々なデータセットに対する以前のアプローチよりも下流画像の分類を改善する。
論文 参考訳(メタデータ) (2024-07-15T17:10:31Z) - SDFD: Building a Versatile Synthetic Face Image Dataset with Diverse Attributes [14.966767182001755]
顔の多様性の幅広いスペクトルをキャプチャする合成顔画像データセットを生成する手法を提案する。
具体的には、我々のアプローチは人口統計学とバイオメトリックスを統合するだけでなく、メイクアップ、ヘアスタイル、アクセサリーといった非永続的な特徴も統合しています。
これらのプロンプトは、高品質なリアル画像の包括的なデータセットを生成する際に、最先端のテキスト・ツー・イメージモデルを導く。
論文 参考訳(メタデータ) (2024-04-26T08:51:31Z) - DiffusionFace: Towards a Comprehensive Dataset for Diffusion-Based Face Forgery Analysis [71.40724659748787]
DiffusionFaceは、最初の拡散ベースのフェイスフォージェリーデータセットである。
非条件およびテキストガイドの顔画像生成、Img2Img、Inpaint、Diffusionベースの顔交換アルゴリズムなど、さまざまなフォージェリーカテゴリをカバーする。
重要なメタデータと、評価のための実世界のインターネットソースの偽顔画像データセットを提供する。
論文 参考訳(メタデータ) (2024-03-27T11:32:44Z) - Disguise without Disruption: Utility-Preserving Face De-Identification [40.484745636190034]
本研究では,修正データの利用性を確保しつつ,顔画像をシームレスに識別する新しいアルゴリズムであるDisguiseを紹介する。
本手法は, 難読化と非可逆性を最大化するために, 変分機構を用いて生成した合成物を用いて, 描写されたアイデンティティを抽出し置換することを含む。
提案手法を複数のデータセットを用いて広範に評価し,様々な下流タスクにおける従来の手法と比較して,高い非識別率と一貫性を示す。
論文 参考訳(メタデータ) (2023-03-23T13:50:46Z) - ConfounderGAN: Protecting Image Data Privacy with Causal Confounder [85.6757153033139]
本稿では,GAN(Generative Adversarial Network)のConfounderGANを提案する。
実験は、3つの自然なオブジェクトデータセットと3つの医療データセットからなる6つの画像分類データセットで実施される。
論文 参考訳(メタデータ) (2022-12-04T08:49:14Z) - Assessing Demographic Bias Transfer from Dataset to Model: A Case Study
in Facial Expression Recognition [1.5340540198612824]
2つのメトリクスはデータセットの表現バイアスとステレオタイプバイアスに焦点をあて、もう1つはトレーニングされたモデルの残差バイアスに焦点を当てている。
本稿では、一般的なAffectnetデータセットに基づくFER問題に適用することで、メトリクスの有用性を示す。
論文 参考訳(メタデータ) (2022-05-20T09:40:42Z) - EDFace-Celeb-1M: Benchmarking Face Hallucination with a Million-scale
Dataset [92.537021496096]
近年の深層顔の幻覚法は,超解像性難分解性顔画像において顕著な性能を示した。
したがって、これらのアルゴリズムが公衆の顔の幻覚データセット上でどのように機能するかは不明である。
本稿では,Ethnically Diverse Face データセット EDFace-Celeb-1M を構築し,顔幻覚のためのベンチマークタスクを設計する。
論文 参考訳(メタデータ) (2021-10-11T06:53:24Z) - Personalized Image Semantic Segmentation [58.980245748434]
ラベルのないパーソナライズされた画像に対して、データのパーソナライズされた特徴を調査することにより、より正確なセグメンテーション結果を生成する。
画像のセグメント化時に画像間コンテキストを組み込んだベースライン手法を提案する。
コードとPSSデータセットは公開されます。
論文 参考訳(メタデータ) (2021-07-24T04:03:11Z) - Reducing bias and increasing utility by federated generative modeling of
medical images using a centralized adversary [10.809871958865447]
共同学習を可能にする生成メカニズムであるFELICIA(Federated LearnIng with a CentralIzed Adversary)を紹介します。
限定的かつ偏りのあるデータを持つデータ所有者が、すべてのソースからのデータをプライベートに保ちながら、他のデータ所有者の利益を享受する方法を示します。
これは、プライバシー法がデータをローカルな施設外で共有することを防ぐ医療画像解析において一般的なシナリオである。
論文 参考訳(メタデータ) (2021-01-18T18:40:46Z) - Enhancing Facial Data Diversity with Style-based Face Aging [59.984134070735934]
特に、顔データセットは、通常、性別、年齢、人種などの属性の観点からバイアスされる。
本稿では, 細粒度の老化パターンをキャプチャするデータ拡張のための, 生成スタイルに基づく新しいアーキテクチャを提案する。
提案手法は, 年齢移動のための最先端アルゴリズムよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-06-06T21:53:44Z) - A Method for Curation of Web-Scraped Face Image Datasets [13.893682217746816]
データセットを集める際には、さまざまな問題が発生する。
何百万もの画像が存在しているため、手作業によるクリーニングは不可能である。
本稿では,顔認識手法をテストするためのクリーンなデータセットを提供することを目標とする半自動手法を提案する。
論文 参考訳(メタデータ) (2020-04-07T01:57:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。