論文の概要: A Comparative Study of Image-to-Image Translation Using GANs for
Synthetic Child Race Data
- arxiv url: http://arxiv.org/abs/2308.04232v1
- Date: Tue, 8 Aug 2023 12:54:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-09 12:56:10.428888
- Title: A Comparative Study of Image-to-Image Translation Using GANs for
Synthetic Child Race Data
- Title(参考訳): 合成子レースデータにおけるGANを用いた画像間変換の比較検討
- Authors: Wang Yao, Muhammad Ali Farooq, Joseph Lemley, Peter Corcoran
- Abstract要約: 本研究では、画像から画像への変換を利用して、異なる人種のデータを合成し、子供の顔データの民族性を調整することを提案する。
我々は、民族をスタイルとみなし、コーカサス人の児童データとアジア人の児童データ変換を実装するために、3つの異なる画像と画像のニューラルネットワークに基づく手法を比較した。
- 参考スコア(独自算出の注目度): 1.6536018920603175
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The lack of ethnic diversity in data has been a limiting factor of face
recognition techniques in the literature. This is particularly the case for
children where data samples are scarce and presents a challenge when seeking to
adapt machine vision algorithms that are trained on adult data to work on
children. This work proposes the utilization of image-to-image transformation
to synthesize data of different races and thus adjust the ethnicity of
children's face data. We consider ethnicity as a style and compare three
different Image-to-Image neural network based methods, specifically pix2pix,
CycleGAN, and CUT networks to implement Caucasian child data and Asian child
data conversion. Experimental validation results on synthetic data demonstrate
the feasibility of using image-to-image transformation methods to generate
various synthetic child data samples with broader ethnic diversity.
- Abstract(参考訳): データにおける民族多様性の欠如は、文献における顔認識技術の限界要因となっている。
これは、データサンプルが不足している子供に特に当てはまり、成人データに基づいて訓練されたマシンビジョンアルゴリズムを子供に適応させようとする際の課題である。
本研究では,画像から画像への変換を利用して異なる人種のデータを合成し,児童の顔データの民族性を調整することを提案する。
ピク2ピク、サイクガン、カットネットワークという3つの異なる画像から画像へのニューラルネットワーク手法を比較し、コーカサス的児童データとアジアの児童データ変換を実装した。
画像から画像への変換手法を用いて、幅広い民族多様性を持つ様々な合成子データサンプルを作成することが可能であることを示す。
関連論文リスト
- ChildDiffusion: Unlocking the Potential of Generative AI and Controllable Augmentations for Child Facial Data using Stable Diffusion and Large Language Models [1.1470070927586018]
この枠組みは、民族データ、微妙な表現、顔ポーズのバリエーション、目まき効果、異なる髪の色とスタイル、老化、複数と異なる子供の性別を単一のフレームでレンダリングすることによって検証される。
提案手法は、時間的不整合や出力の限られた制御など、生成AIツールで発生する一般的な問題を回避している。
論文 参考訳(メタデータ) (2024-06-17T14:37:14Z) - Towards Inclusive Face Recognition Through Synthetic Ethnicity Alteration [11.451395489475647]
我々は、データセットの多様性を高めるために合成顔画像生成法を用いて、民族的変化と肌のトーン修正を探索する。
まず,アジア,黒人,インディアンの3民族を表わすバランスのとれた顔画像データセットを構築し,詳細な分析を行う。
次に、既存のGAN(Generative Adversarial Network-based Image-to-image translation)と多様体学習モデルを用いて、それぞれの民族性を変化させる。
論文 参考訳(メタデータ) (2024-05-02T13:31:09Z) - ChildGAN: Large Scale Synthetic Child Facial Data Using Domain
Adaptation in StyleGAN [1.6536018920603175]
ChildGANは、転写学習を用いてスムーズなドメイン転送を実行することで構築される。
データセットは300万以上の異なるデータサンプルで構成されている。
その結果,高画質の合成顔データにより,実子から大規模データセットを収集するコストと複雑さの代替効果が示された。
論文 参考訳(メタデータ) (2023-07-25T18:04:52Z) - Child Face Recognition at Scale: Synthetic Data Generation and
Performance Benchmark [3.4110993541168853]
HDA-SynChildFacesは1,652人の被験者と188,832人の画像で構成され、各被験者は様々な年齢で存在し、多くの異なる物体内変異を持つ。
生成したデータベース上での様々な顔認識システムの性能評価を行い、年齢の異なる大人と子供の結果と比較した。
論文 参考訳(メタデータ) (2023-04-23T15:29:26Z) - Is synthetic data from generative models ready for image recognition? [69.42645602062024]
本研究では,最新のテキスト・画像生成モデルから生成した合成画像が,画像認識タスクにどのように利用できるかを検討した。
本稿では,既存の生成モデルからの合成データの強大さと欠点を示し,認識タスクに合成データを適用するための戦略を提案する。
論文 参考訳(メタデータ) (2022-10-14T06:54:24Z) - Studying Bias in GANs through the Lens of Race [91.95264864405493]
本研究では, 画像生成モデルの性能と評価が, 学習データセットの人種構成にどのように影響するかを検討する。
その結果, 生成した画像の人種構成は, トレーニングデータの保存に成功していることがわかった。
しかし、推論中に高品質な画像を生成する手法であるトランケーションは、データの人種的不均衡を悪化させる。
論文 参考訳(メタデータ) (2022-09-06T22:25:56Z) - Random Network Distillation as a Diversity Metric for Both Image and
Text Generation [62.13444904851029]
我々は、どんな種類のデータにも、どんな種類のデータにも、自然にも適用できる新しい多様性指標を開発した。
私たちはこのメトリクスを画像とテキストの両方で検証し、デプロイします。
論文 参考訳(メタデータ) (2020-10-13T22:03:52Z) - Enhancing Facial Data Diversity with Style-based Face Aging [59.984134070735934]
特に、顔データセットは、通常、性別、年齢、人種などの属性の観点からバイアスされる。
本稿では, 細粒度の老化パターンをキャプチャするデータ拡張のための, 生成スタイルに基づく新しいアーキテクチャを提案する。
提案手法は, 年齢移動のための最先端アルゴリズムよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-06-06T21:53:44Z) - Exploring Racial Bias within Face Recognition via per-subject
Adversarially-Enabled Data Augmentation [15.924281804465252]
本稿では,オブジェクト単位のデータセットバランスの実現を目的とした,新たな逆派生データ拡張手法を提案する。
我々の目的は、様々な人種領域にまたがる顔画像を変換することで、合成データセットを自動構築することである。
両面比較では,提案手法が(人種)少数集団の認識性能に与える影響が示唆された。
論文 参考訳(メタデータ) (2020-04-19T19:46:32Z) - Pathological Retinal Region Segmentation From OCT Images Using Geometric
Relation Based Augmentation [84.7571086566595]
本稿では,幾何学と形状の内在的関係を共同で符号化することで,従来のGANベースの医用画像合成法よりも優れた手法を提案する。
提案手法は,取得手順の異なる画像を有する公開RETOUCHデータセット上で,最先端のセグメンテーション手法より優れている。
論文 参考訳(メタデータ) (2020-03-31T11:50:43Z) - Joint Deep Learning of Facial Expression Synthesis and Recognition [97.19528464266824]
顔表情の合成と認識を効果的に行うための新しい統合深層学習法を提案する。
提案手法は, 2段階の学習手順を伴い, まず, 表情の異なる顔画像を生成するために, 表情合成生成対向ネットワーク (FESGAN) を事前訓練する。
実画像と合成画像間のデータバイアスの問題を軽減するために,新しい実データ誘導バックプロパゲーション(RDBP)アルゴリズムを用いたクラス内損失を提案する。
論文 参考訳(メタデータ) (2020-02-06T10:56:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。