論文の概要: Controlled Face Manipulation and Synthesis for Data Augmentation
- arxiv url: http://arxiv.org/abs/2602.19219v1
- Date: Sun, 22 Feb 2026 15:03:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.538164
- Title: Controlled Face Manipulation and Synthesis for Data Augmentation
- Title(参考訳): データ拡張のための制御された顔操作と合成
- Authors: Joris Kirchner, Amogh Gudi, Marian Bittner, Chirag Raman,
- Abstract要約: コントロール可能な画像編集はラベル付きデータの不足を増大させるが、編集はアーティファクトを導入し、非ターゲット属性をアンタングルすることが多い。
本研究では, 顔表情分析において, アクション・ユニット(AU)の操作を対象とする手法について検討する。
予め訓練された顔生成装置のセマンティック潜在空間で機能する顔操作法を提案する。
- 参考スコア(独自算出の注目度): 2.8173956667218305
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning vision models excel with abundant supervision, but many applications face label scarcity and class imbalance. Controllable image editing can augment scarce labeled data, yet edits often introduce artifacts and entangle non-target attributes. We study this in facial expression analysis, targeting Action Unit (AU) manipulation where annotation is costly and AU co-activation drives entanglement. We present a facial manipulation method that operates in the semantic latent space of a pre-trained face generator (Diffusion Autoencoder). Using lightweight linear models, we reduce entanglement of semantic features via (i) dependency-aware conditioning that accounts for AU co-activation, and (ii) orthogonal projection that removes nuisance attribute directions (e.g., glasses), together with an expression neutralization step to enable absolute AU edit. We use these edits to balance AU occurrence by editing labeled faces and to diversify identities/demographics via controlled synthesis. Augmenting AU detector training with the generated data improves accuracy and yields more disentangled predictions with fewer co-activation shortcuts, outperforming alternative data-efficient training strategies and suggesting improvements similar to what would require substantially more labeled data in our learning-curve analysis. Compared to prior methods, our edits are stronger, produce fewer artifacts, and preserve identity better.
- Abstract(参考訳): 深層学習ビジョンモデルは、豊富な監視に優れるが、多くのアプリケーションはラベル不足とクラス不均衡に直面している。
コントロール可能な画像編集はラベル付きデータの不足を増大させるが、編集はアーティファクトを導入し、非ターゲット属性をアンタングルすることが多い。
本研究では、アノテーションが高価であり、AUコアクティベーションが絡み合うアクションユニット(AU)をターゲットとした表情解析においてこれを研究する。
本稿では,事前学習した顔生成装置(Diffusion Autoencoder)の潜時空間で動作する顔操作手法を提案する。
軽量線形モデルを用いて意味的特徴の絡み合いを低減する
(i)AUコアクティベーションを考慮に入れた依存性対応条件、及び
(II)直交投影によりニュアンス特性方向(例えばメガネ)を除去し、表現中性化ステップを伴って絶対AU編集を可能にする。
これらの編集は、ラベル付き顔の編集によるAU発生のバランスと、制御された合成によるアイデンティティ/デマトグラフィーの多様化に利用される。
生成されたデータを用いてAU検出器のトレーニングを強化することにより、精度が向上し、コアクティベーションショートカットが少なく、より不整合な予測が得られ、代替データ効率のトレーニング戦略よりも優れ、学習曲線解析においてかなり多くのラベル付きデータを必要とするものに似た改善が提案される。
従来の方法と比較して、編集はより強く、アーティファクトは少なく、アイデンティティはより良く保たれる。
関連論文リスト
- Unsupervised Exposure Correction [32.76710029538801]
本稿では,手動アノテーションの必要性を解消する,革新的なUnsupervised Exposure Correction(UEC)手法を提案する。
我々のモデルは、エミュレートされた画像信号処理(ISP)パイプラインから利用可能なペアデータを用いて訓練されている。
我々は、画像の詳細を保存し、最先端の教師付き手法より優れた変換関数を開発する。
論文 参考訳(メタデータ) (2025-07-23T06:46:22Z) - Mitigating the Impact of Attribute Editing on Face Recognition [14.138965856511387]
現代の生成型AIモデルを用いた顔属性の編集は、顔認識システムを著しく劣化させる可能性があることを示す。
局所的およびグローバルな属性編集のための2つの新しい手法を提案する。
論文 参考訳(メタデータ) (2024-03-12T22:03:19Z) - Graph Masked Autoencoder for Sequential Recommendation [10.319298705782058]
本稿では,自動エンコーダ付きシーケンシャルレコメンダシステム(MAERec, Graph Masked AutoEncoder-enhanced Sequence Recommender System)を提案する。
提案手法は最先端のベースラインモデルを大幅に上回り,データノイズや空間性に対するより正確な表現を学習することができる。
論文 参考訳(メタデータ) (2023-05-08T10:57:56Z) - Masked Autoencoding for Scalable and Generalizable Decision Making [93.84855114717062]
MaskDPは、強化学習と行動クローンのためのシンプルでスケーラブルな自己教師付き事前学習手法である。
我々は,MaskDPモデルにより,単一ゴールや複数ゴール到達といった新しいBCタスクへのゼロショット転送能力が得られることを発見した。
論文 参考訳(メタデータ) (2022-11-23T07:04:41Z) - UIA-ViT: Unsupervised Inconsistency-Aware Method based on Vision
Transformer for Face Forgery Detection [52.91782218300844]
そこで我々は、UIA-ViTと呼ばれるビジョン変換器に基づく教師なし不整合認識手法を提案する。
自己注意機構により、パッチ埋め込み間の注意マップは自然に一貫性関係を表現し、一貫性表現学習に適した視覚変換器となる。
論文 参考訳(メタデータ) (2022-10-23T15:24:47Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Uncertain Label Correction via Auxiliary Action Unit Graphs for Facial
Expression Recognition [46.99756911719854]
ULC-AGと呼ばれる補助行動単位(AU)グラフを用いて,表情の不確実なラベル補正を実現する。
ULC-AGはRAF-DBとAffectNetのデータセットでそれぞれ89.31%と61.57%の精度を達成した。
論文 参考訳(メタデータ) (2022-04-23T11:09:43Z) - Unsupervised Domain Adaptive Salient Object Detection Through
Uncertainty-Aware Pseudo-Label Learning [104.00026716576546]
そこで本研究では,手動のアノテーションを使わずに,自然に高いピクセルラベル品質を有する合成・クリーンなラベルから,サリエンスを学習することを提案する。
提案手法は,複数のベンチマークデータセット上で,既存の最先端の深層教師なしSOD法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-02-26T16:03:55Z) - Hierarchical Variational Autoencoder for Visual Counterfactuals [79.86967775454316]
条件変量オート(VAE)は、説明可能な人工知能(XAI)ツールとして注目されている。
本稿では, 後部の効果がいかに緩和され, 対物的効果が成功するかを示す。
本稿では,アプリケーション内の分類器を視覚的に監査できる階層型VAEについて紹介する。
論文 参考訳(メタデータ) (2021-02-01T14:07:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。