論文の概要: Multi-Task Faces (MTF) Data Set: A Legally and Ethically Compliant
Collection of Face Images for Various Classification Tasks
- arxiv url: http://arxiv.org/abs/2311.11882v1
- Date: Mon, 20 Nov 2023 16:19:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2023-11-21 18:02:43.828208
- Title: Multi-Task Faces (MTF) Data Set: A Legally and Ethically Compliant
Collection of Face Images for Various Classification Tasks
- Title(参考訳): Multi-Task Faces (MTF) データセット: 様々な分類課題に対する法的かつ倫理的に整合した顔画像の収集
- Authors: Rami Haffar, David S\'anchez, and Josep Domingo-Ferrer
- Abstract要約: 最近のプライバシー規制は、人間の画像の収集と研究の方法を制限する。
人間の顔を含むいくつかのデータセットは、不十分なデータ収集方法のため、インターネットから削除されている。
本稿では,多面顔画像データセットであるMTF(Multi-Task Faces)について述べる。
- 参考スコア(独自算出の注目度): 3.1133049660590615
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human facial data hold tremendous potential to address a variety of
classification problems, including face recognition, age estimation, gender
identification, emotion analysis, and race classification. However, recent
privacy regulations, such as the EU General Data Protection Regulation and
others, have restricted the ways in which human images may be collected and
used for research. As a result, several previously published data sets
containing human faces have been removed from the internet due to inadequate
data collection methods that failed to meet privacy regulations. Data sets
consisting of synthetic data have been proposed as an alternative, but they
fall short of accurately representing the real data distribution. On the other
hand, most available data sets are labeled for just a single task, which limits
their applicability. To address these issues, we present the Multi-Task Faces
(MTF) image data set, a meticulously curated collection of face images designed
for various classification tasks, including face recognition, as well as race,
gender, and age classification. The MTF data set has been ethically gathered by
leveraging publicly available images of celebrities and strictly adhering to
copyright regulations. In this paper, we present this data set and provide
detailed descriptions of the followed data collection and processing
procedures. Furthermore, we evaluate the performance of five deep learning (DL)
models on the MTF data set across the aforementioned classification tasks.
Additionally, we compare the performance of DL models over the processed MTF
data and over raw data crawled from the internet. The reported results
constitute a baseline for further research employing these data. The MTF data
set can be accessed through the following link (please cite the present paper
if you use the data set): https://github.com/RamiHaf/MTF_data_set
- Abstract(参考訳): 人間の顔データは、顔認識、年齢推定、性別識別、感情分析、人種分類など、さまざまな分類問題に対処する大きな可能性を秘めている。
しかし、eu一般データ保護規則などの最近のプライバシー規制では、人間の画像が収集され、研究に利用される方法が制限されている。
その結果、プライバシー規制を満たさない不適切なデータ収集方法のために、人間の顔を含むいくつかのデータセットがインターネットから削除された。
合成データからなるデータセットは代替案として提案されているが、実際のデータ分布を正確に表現できない。
一方、ほとんどの利用可能なデータセットは単一のタスクのためにラベル付けされているため、適用性は制限される。
これらの問題に対処するため,我々は,顔認識や人種,性別,年齢分類など,さまざまな分類タスク用に設計された顔画像の集合であるmulti-task faces (mtf) 画像データセットを提案する。
MTFデータセットは、有名人の公開画像を活用し、著作権規制を厳格に遵守することで倫理的に収集されている。
本稿では,このデータセットとそれに続くデータ収集および処理手順の詳細について述べる。
さらに,上記の分類課題にまたがるMTFデータセット上での5つのディープラーニング(DL)モデルの性能評価を行った。
さらに,加工したMTFデータとインターネットからクロールした生データのDLモデルの性能を比較した。
報告された結果は、これらのデータを用いたさらなる研究のベースラインを構成する。
MTFデータセットは、以下のリンクを通じてアクセスすることができる(データセットを使用すると、この論文を引用する)。
関連論文リスト
- Human Body Restoration with One-Step Diffusion Model and A New Benchmark [74.66514054623669]
本稿では,高品質な自動収穫・フィルタリング(HQ-ACF)パイプラインを提案する。
このパイプラインは、既存のオブジェクト検出データセットやその他のラベル付けされていないイメージを活用して、高品質な人間の画像を自動的にトリミングし、フィルタリングする。
また,人体修復のための新しい1段階拡散モデルであるemphOSDHumanを提案する。
論文 参考訳(メタデータ) (2025-02-03T14:48:40Z) - DataDream: Few-shot Guided Dataset Generation [90.09164461462365]
実データ分布をより忠実に表現する分類データセットを合成するためのフレームワークを提案する。
DataDream fine-tunes LoRA weights for the image generation model on the few real image before generated the training data using the adapt model。
次に、合成データを用いてCLIPのLoRA重みを微調整し、様々なデータセットに対する以前のアプローチよりも下流画像の分類を改善する。
論文 参考訳(メタデータ) (2024-07-15T17:10:31Z) - SDFD: Building a Versatile Synthetic Face Image Dataset with Diverse Attributes [14.966767182001755]
顔の多様性の幅広いスペクトルをキャプチャする合成顔画像データセットを生成する手法を提案する。
具体的には、我々のアプローチは人口統計学とバイオメトリックスを統合するだけでなく、メイクアップ、ヘアスタイル、アクセサリーといった非永続的な特徴も統合しています。
これらのプロンプトは、高品質なリアル画像の包括的なデータセットを生成する際に、最先端のテキスト・ツー・イメージモデルを導く。
論文 参考訳(メタデータ) (2024-04-26T08:51:31Z) - DiffusionFace: Towards a Comprehensive Dataset for Diffusion-Based Face Forgery Analysis [71.40724659748787]
DiffusionFaceは、最初の拡散ベースのフェイスフォージェリーデータセットである。
非条件およびテキストガイドの顔画像生成、Img2Img、Inpaint、Diffusionベースの顔交換アルゴリズムなど、さまざまなフォージェリーカテゴリをカバーする。
重要なメタデータと、評価のための実世界のインターネットソースの偽顔画像データセットを提供する。
論文 参考訳(メタデータ) (2024-03-27T11:32:44Z) - Disguise without Disruption: Utility-Preserving Face De-Identification [40.484745636190034]
本研究では,修正データの利用性を確保しつつ,顔画像をシームレスに識別する新しいアルゴリズムであるDisguiseを紹介する。
本手法は, 難読化と非可逆性を最大化するために, 変分機構を用いて生成した合成物を用いて, 描写されたアイデンティティを抽出し置換することを含む。
提案手法を複数のデータセットを用いて広範に評価し,様々な下流タスクにおける従来の手法と比較して,高い非識別率と一貫性を示す。
論文 参考訳(メタデータ) (2023-03-23T13:50:46Z) - ConfounderGAN: Protecting Image Data Privacy with Causal Confounder [85.6757153033139]
本稿では,GAN(Generative Adversarial Network)のConfounderGANを提案する。
実験は、3つの自然なオブジェクトデータセットと3つの医療データセットからなる6つの画像分類データセットで実施される。
論文 参考訳(メタデータ) (2022-12-04T08:49:14Z) - A Masked Face Classification Benchmark on Low-Resolution Surveillance
Images [7.199382835973642]
Small Face MASK (SF-MASK) は、多種多様な異種データセットからエクスポートされた20kの低解像度画像からなるコレクションである。
特に、非常に高いカメラで撮影された顔は、顔の特徴が強く歪んでいるように見えるが、欠落している。
1701枚の画像の小さなサブサンプルには、ひどく摩耗したフェイスマスクが含まれており、マルチクラスの分類に挑戦している。
論文 参考訳(メタデータ) (2022-11-23T15:57:16Z) - How to Boost Face Recognition with StyleGAN? [13.067766076889995]
最先端の顔認識システムは大量のラベル付きトレーニングデータを必要とする。
業界における自己監督的革命は、関連する技術が顔認識に適応する研究を動機付けている。
StyleGANのための微調整pSpエンコーダに基づく簡単なアプローチにより、最先端の顔認識を改善することができることを示す。
論文 参考訳(メタデータ) (2022-10-18T18:41:56Z) - Assessing Demographic Bias Transfer from Dataset to Model: A Case Study
in Facial Expression Recognition [1.5340540198612824]
2つのメトリクスはデータセットの表現バイアスとステレオタイプバイアスに焦点をあて、もう1つはトレーニングされたモデルの残差バイアスに焦点を当てている。
本稿では、一般的なAffectnetデータセットに基づくFER問題に適用することで、メトリクスの有用性を示す。
論文 参考訳(メタデータ) (2022-05-20T09:40:42Z) - EDFace-Celeb-1M: Benchmarking Face Hallucination with a Million-scale
Dataset [92.537021496096]
近年の深層顔の幻覚法は,超解像性難分解性顔画像において顕著な性能を示した。
したがって、これらのアルゴリズムが公衆の顔の幻覚データセット上でどのように機能するかは不明である。
本稿では,Ethnically Diverse Face データセット EDFace-Celeb-1M を構築し,顔幻覚のためのベンチマークタスクを設計する。
論文 参考訳(メタデータ) (2021-10-11T06:53:24Z) - Inferring Offensiveness In Images From Natural Language Supervision [20.294073012815854]
ウェブから自動的に取り除かれた大規模な画像データセットには、カテゴリや攻撃的なイメージといった軽蔑的な用語が含まれる可能性がある。
我々は、事前学習されたトランスフォーマー自体が、大規模ビジョンデータセットの自動キュレーションのための方法論を提供することを示した。
論文 参考訳(メタデータ) (2021-10-08T16:19:21Z) - Personalized Image Semantic Segmentation [58.980245748434]
ラベルのないパーソナライズされた画像に対して、データのパーソナライズされた特徴を調査することにより、より正確なセグメンテーション結果を生成する。
画像のセグメント化時に画像間コンテキストを組み込んだベースライン手法を提案する。
コードとPSSデータセットは公開されます。
論文 参考訳(メタデータ) (2021-07-24T04:03:11Z) - Balancing Biases and Preserving Privacy on Balanced Faces in the Wild [50.915684171879036]
現在の顔認識(FR)モデルには、人口統計バイアスが存在する。
さまざまな民族と性別のサブグループにまたがる偏見を測定するために、我々のバランス・フェイススをWildデータセットに導入します。
真偽と偽のサンプルペアを区別するために1点のスコアしきい値に依存すると、最適以下の結果が得られます。
本稿では,最先端ニューラルネットワークから抽出した顔特徴を用いたドメイン適応学習手法を提案する。
論文 参考訳(メタデータ) (2021-03-16T15:05:49Z) - Reducing bias and increasing utility by federated generative modeling of
medical images using a centralized adversary [10.809871958865447]
共同学習を可能にする生成メカニズムであるFELICIA(Federated LearnIng with a CentralIzed Adversary)を紹介します。
限定的かつ偏りのあるデータを持つデータ所有者が、すべてのソースからのデータをプライベートに保ちながら、他のデータ所有者の利益を享受する方法を示します。
これは、プライバシー法がデータをローカルな施設外で共有することを防ぐ医療画像解析において一般的なシナリオである。
論文 参考訳(メタデータ) (2021-01-18T18:40:46Z) - Enhancing Facial Data Diversity with Style-based Face Aging [59.984134070735934]
特に、顔データセットは、通常、性別、年齢、人種などの属性の観点からバイアスされる。
本稿では, 細粒度の老化パターンをキャプチャするデータ拡張のための, 生成スタイルに基づく新しいアーキテクチャを提案する。
提案手法は, 年齢移動のための最先端アルゴリズムよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-06-06T21:53:44Z) - Investigating Bias in Deep Face Analysis: The KANFace Dataset and
Empirical Study [67.3961439193994]
現在までに最も包括的で大規模な顔画像とビデオのデータセットを導入している。
データは、アイデンティティ、正確な年齢、性別、親族関係の点で手動で注釈付けされる。
提案したベンチマークでネットワーク埋め込みをデバイアス化する手法を導入し,テストした。
論文 参考訳(メタデータ) (2020-05-15T00:14:39Z) - Boosting Semantic Human Matting with Coarse Annotations [66.8725980604434]
粗いアノテートされた人間のデータセットは、公開データセットから取得し、収集するのがずっと簡単です。
マットリファインメントネットワークは、統一マスクと入力画像とを取り込み、最終アルファマットを予測する。
論文 参考訳(メタデータ) (2020-04-10T09:11:02Z) - A Method for Curation of Web-Scraped Face Image Datasets [13.893682217746816]
データセットを集める際には、さまざまな問題が発生する。
何百万もの画像が存在しているため、手作業によるクリーニングは不可能である。
本稿では,顔認識手法をテストするためのクリーンなデータセットを提供することを目標とする半自動手法を提案する。
論文 参考訳(メタデータ) (2020-04-07T01:57:32Z) - PrivacyNet: Semi-Adversarial Networks for Multi-attribute Face Privacy [15.301150389512744]
画像手法を用いて, 顔画像に対するソフトバイオメトリック・プライバシを実現する手法を開発した。
画像摂動は、GANをベースとしたSAN(Semi-Adversarial Network)を用いて行われる。
PrivacyNetでは、入力された顔画像に難読化される属性を選択することができる。
論文 参考訳(メタデータ) (2020-01-02T18:53:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。