論文の概要: Two-Step Data Augmentation for Masked Face Detection and Recognition: Turning Fake Masks to Real
- arxiv url: http://arxiv.org/abs/2512.15774v1
- Date: Sat, 13 Dec 2025 15:20:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-19 18:10:31.691483
- Title: Two-Step Data Augmentation for Masked Face Detection and Recognition: Turning Fake Masks to Real
- Title(参考訳): マスク付き顔検出・認識のための2ステップデータ拡張:フェイクマスクを現実に
- Authors: Yan Yang, George Bebis, Mircea Nicolescu,
- Abstract要約: 本稿では,ルールベースのマスクワープとGANを用いた画像間変換を併用した2段階の生成データ拡張フレームワークを提案する。
ルールベースのワープのみと比較して、提案手法は一貫性のある質的改善をもたらす。
我々は,非マスク損失保存とノイズ注入を導入し,トレーニングを安定させ,サンプルの多様性を高める。
- 参考スコア(独自算出の注目度): 5.1215389305751735
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Data scarcity and distribution shift pose major challenges for masked face detection and recognition. We propose a two-step generative data augmentation framework that combines rule-based mask warping with unpaired image-to-image translation using GANs, enabling the generation of realistic masked-face samples beyond purely synthetic transformations. Compared to rule-based warping alone, the proposed approach yields consistent qualitative improvements and complements existing GAN-based masked face generation methods such as IAMGAN. We introduce a non-mask preservation loss and stochastic noise injection to stabilize training and enhance sample diversity. Experimental observations highlight the effectiveness of the proposed components and suggest directions for future improvements in data-centric augmentation for face recognition tasks.
- Abstract(参考訳): データ不足と分散シフトは、マスクされた顔の検出と認識において大きな課題となる。
本稿では,ルールベースのマスクワープとGANを用いた画像間変換を併用した2段階の生成データ拡張フレームワークを提案する。
ルールベースのワープのみと比較して、提案手法は一貫性のある質的改善をもたらし、IAMGANのような既存のGANベースのマスクフェース生成手法を補完する。
我々は,非マスク保存損失と確率的ノイズ注入を導入し,トレーニングを安定させ,サンプルの多様性を高める。
実験により,提案するコンポーネントの有効性が強調され,顔認識タスクにおけるデータ中心の強化に向けた方向性が示唆された。
関連論文リスト
- Diffusion-Guided Mask-Consistent Paired Mixing for Endoscopic Image Segmentation [57.37991748282666]
本稿では, 試料混合と拡散合成の強度を融合した拡散誘導型パラダイムを提案する。
各実画像について、合成対を同じマスクの下で生成し、その対をマスク一貫性ペアドミキシング(MCPMix)の制御可能な入力として使用する。
これは、共有幾何学の下で合成および実際の外観を円滑にブリッジする中間サンプルの連続的な族を生成する。
論文 参考訳(メタデータ) (2025-11-05T06:14:19Z) - Imperceptible Face Forgery Attack via Adversarial Semantic Mask [59.23247545399068]
本稿では, 対向性, 可視性に優れた対向性例を生成できるASMA(Adversarial Semantic Mask Attack framework)を提案する。
具体的には, 局所的なセマンティック領域の摂動を抑制し, 良好なステルス性を実現する, 対向型セマンティックマスク生成モデルを提案する。
論文 参考訳(メタデータ) (2024-06-16T10:38:11Z) - DiffusionFace: Towards a Comprehensive Dataset for Diffusion-Based Face Forgery Analysis [71.40724659748787]
DiffusionFaceは、最初の拡散ベースのフェイスフォージェリーデータセットである。
非条件およびテキストガイドの顔画像生成、Img2Img、Inpaint、Diffusionベースの顔交換アルゴリズムなど、さまざまなフォージェリーカテゴリをカバーする。
重要なメタデータと、評価のための実世界のインターネットソースの偽顔画像データセットを提供する。
論文 参考訳(メタデータ) (2024-03-27T11:32:44Z) - DeepFidelity: Perceptual Forgery Fidelity Assessment for Deepfake
Detection [67.3143177137102]
ディープフェイク検出(Deepfake detection)とは、画像やビデオにおいて、人工的に生成された顔や編集された顔を検出すること。
本稿では,実顔と偽顔とを適応的に識別するDeepFidelityという新しいDeepfake検出フレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-07T07:19:45Z) - Semantic-aware One-shot Face Re-enactment with Dense Correspondence
Estimation [100.60938767993088]
ワンショットの顔の再現は、ソースと駆動する顔の同一性ミスマッチのため、難しい作業である。
本稿では,3次元形態素モデル(3DMM)を明示的な顔のセマンティックな分解とアイデンティティの絡み合いに利用することを提案する。
論文 参考訳(メタデータ) (2022-11-23T03:02:34Z) - Calibrated Hyperspectral Image Reconstruction via Graph-based
Self-Tuning Network [40.71031760929464]
ハイパースペクトルイメージング(HSI)は、特に符号化スナップショット分光イメージング(CASSI)システムに基づく画像に対して、研究の注目を集めている。
既存の深いHSI再構成モデルは、CASSIの特定の光学ハードウェアマスクが与える2次元圧縮計測に基づいて元の信号を取得するために、ペアデータで訓練される。
このマスク固有のトレーニングスタイルは、ハードウェアの誤校正問題を引き起こし、異なるハードウェアとノイズの多い環境間で深いHSIモデルをデプロイする障壁を設定できる。
マスクの空間構造の変化に適応する不確実性を推論するグラフベース自己調整(GST)ネットワークを提案する。
論文 参考訳(メタデータ) (2021-12-31T09:39:13Z) - Development of a face mask detection pipeline for mask-wearing
monitoring in the era of the COVID-19 pandemic: A modular approach [0.0]
SARS-Cov-2パンデミックの間、マスク着用はウイルスの拡散や収縮を防ぐための効果的な手段となった。
人口のマスク着用率を監視する能力は、ウイルスに対する公衆衛生戦略を決定するのに役立つだろう。
1)顔検出とアライメント,2)顔マスク分類の2つのモジュールからなる2段階の顔マスク検出手法を提案する。
論文 参考訳(メタデータ) (2021-12-30T12:32:33Z) - Mask-invariant Face Recognition through Template-level Knowledge
Distillation [3.727773051465455]
マスクは従来の顔認識システムの性能に影響を与える。
マスク不変顔認識ソリューション(MaskInv)を提案する。
蒸留された知識に加えて、学生ネットワークは、マージンベースのアイデンティティ分類損失による追加ガイダンスの恩恵を受ける。
論文 参考訳(メタデータ) (2021-12-10T16:19:28Z) - Unmasking Face Embeddings by Self-restrained Triplet Loss for Accurate
Masked Face Recognition [6.865656740940772]
マスク付き顔認識性能を改善するためのソリューションを提案する。
具体的には,既存の顔認識モデル上で動作させるEmbedding Unmasking Model (EUM)を提案する。
また、EUMが同一アイデンティティのマスクされていない顔のこれらに類似した埋め込みを作成することを可能にする新しい損失関数、自己拘束トリプルト(SRT)を提案します。
論文 参考訳(メタデータ) (2021-03-02T13:43:11Z) - Joint Deep Learning of Facial Expression Synthesis and Recognition [97.19528464266824]
顔表情の合成と認識を効果的に行うための新しい統合深層学習法を提案する。
提案手法は, 2段階の学習手順を伴い, まず, 表情の異なる顔画像を生成するために, 表情合成生成対向ネットワーク (FESGAN) を事前訓練する。
実画像と合成画像間のデータバイアスの問題を軽減するために,新しい実データ誘導バックプロパゲーション(RDBP)アルゴリズムを用いたクラス内損失を提案する。
論文 参考訳(メタデータ) (2020-02-06T10:56:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。