論文の概要: Mask-Guided Multi-Task Network for Face Attribute Recognition
- arxiv url: http://arxiv.org/abs/2601.01408v1
- Date: Sun, 04 Jan 2026 07:21:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:22.331895
- Title: Mask-Guided Multi-Task Network for Face Attribute Recognition
- Title(参考訳): マスク型マルチタスクネットワークによる顔属性認識
- Authors: Gong Gao, Zekai Wang, Jian Zhao, Ziqi Xie, Xianhui Liu, Weidong Zhao,
- Abstract要約: Mask-Guided Multi-Task Network (MGMTN) はAdaptive Mask Learning (AML) と Group-Global Feature Fusion (G2FF) を統合している。
AMLは、重要な顔部位を正確にローカライズし、意味のある特徴領域を規定するグループマスクを生成する。
G2FFはグループ機能とグローバル機能を組み合わせてFAR学習を強化し、より正確な属性識別を可能にする。
- 参考スコア(独自算出の注目度): 16.994619834678325
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Face Attribute Recognition (FAR) plays a crucial role in applications such as person re-identification, face retrieval, and face editing. Conventional multi-task attribute recognition methods often process the entire feature map for feature extraction and attribute classification, which can produce redundant features due to reliance on global regions. To address these challenges, we propose a novel approach emphasizing the selection of specific feature regions for efficient feature learning. We introduce the Mask-Guided Multi-Task Network (MGMTN), which integrates Adaptive Mask Learning (AML) and Group-Global Feature Fusion (G2FF) to address the aforementioned limitations. Leveraging a pre-trained keypoint annotation model and a fully convolutional network, AML accurately localizes critical facial parts (e.g., eye and mouth groups) and generates group masks that delineate meaningful feature regions, thereby mitigating negative transfer from global region usage. Furthermore, G2FF combines group and global features to enhance FAR learning, enabling more precise attribute identification. Extensive experiments on two challenging facial attribute recognition datasets demonstrate the effectiveness of MGMTN in improving FAR performance.
- Abstract(参考訳): 顔属性認識(FAR)は、人物の再識別、顔検索、顔編集などのアプリケーションにおいて重要な役割を果たす。
従来のマルチタスク属性認識手法は特徴抽出と属性分類のための特徴マップ全体を処理し,グローバルな領域に依存して冗長な特徴を生成する。
これらの課題に対処するために,効率的な特徴学習のための特定の特徴領域の選択を強調する新しいアプローチを提案する。
本稿では,AML(Adaptive Mask Learning)とG2FF(Group-Global Feature Fusion)を統合したMGMTN(Mask-Guided Multi-Task Network)を提案する。
事前訓練されたキーポイントアノテーションモデルと完全な畳み込みネットワークを活用して、AMLは、重要な顔部分(例えば、目と口のグループ)を正確にローカライズし、意味のある特徴領域を規定するグループマスクを生成し、グローバル領域の使用から負の移動を緩和する。
さらに、G2FFはグループとグローバル機能を組み合わせてFAR学習を強化し、より正確な属性識別を可能にする。
2つの挑戦的な顔属性認識データセットに対する大規模な実験は、FARの性能向上におけるMGMTNの有効性を実証している。
関連論文リスト
- PSVMA+: Exploring Multi-granularity Semantic-visual Adaption for Generalized Zero-shot Learning [116.33775552866476]
一般化ゼロショット学習(GZSL)は、目に見えない領域の知識を用いて、見えないものを識別する試みである。
GZSLは、属性の多様性とインスタンスの多様性により、視覚的セマンティックな対応が不十分である。
本稿では,不整合の解消に十分な視覚要素を収集できる多粒性プログレッシブ・セマンティック・視覚適応ネットワークを提案する。
論文 参考訳(メタデータ) (2024-10-15T12:49:33Z) - Domain Consistency Representation Learning for Lifelong Person Re-Identification [31.076769754593098]
LReID(Lifelong person re-identification)は、連続データから学ぶ際に、ドメイン内識別とドメイン間ギャップの間に矛盾した関係を示す。
ドメイン内識別とドメイン間ギャップのバランスをとるために,グローバルおよび属性ワイド表現を探索する新しいドメイン一貫性表現学習(DCR)モデルを提案する。
我々のDCRは最先端のLReID法と比較して優れた性能を発揮する。
論文 参考訳(メタデータ) (2024-09-30T05:19:09Z) - Other Tokens Matter: Exploring Global and Local Features of Vision Transformers for Object Re-Identification [63.147482497821166]
我々はまず,ViTのグローバルおよびローカルな特徴の影響を探求し,高性能オブジェクトRe-IDのための新しいグローバルローカ変換器(GLTrans)を提案する。
提案手法は,4つのオブジェクトRe-IDベンチマークにおいて優れた性能を実現する。
論文 参考訳(メタデータ) (2024-04-23T12:42:07Z) - TransFA: Transformer-based Representation for Face Attribute Evaluation [87.09529826340304]
我々はtextbfTransFA を用いたtextbfattribute 評価のための新しい textbf Transformer 表現を提案する。
提案するTransFAは,最先端手法と比較して優れた性能を示す。
論文 参考訳(メタデータ) (2022-07-12T10:58:06Z) - MGRR-Net: Multi-level Graph Relational Reasoning Network for Facial Action Units Detection [16.261362598190807]
FACS(Facial Action Coding System)は、顔画像中のアクションユニット(AU)を符号化する。
我々は、AU特徴の符号化は、地域的特徴とグローバルな特徴の間のリッチな文脈情報を捉えないかもしれないと論じる。
顔AU検出のためのマルチレベルグラフ推論ネットワーク(MGRR-Net)を提案する。
論文 参考訳(メタデータ) (2022-04-04T09:47:22Z) - Global Context-Aware Progressive Aggregation Network for Salient Object
Detection [117.943116761278]
我々は,低レベルな外観特徴,高レベルな意味特徴,グローバルな文脈特徴を統合化するための新しいネットワークGCPANetを提案する。
提案手法は, 定量的かつ定性的に, 最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-03-02T04:26:10Z) - DotFAN: A Domain-transferred Face Augmentation Network for Pose and
Illumination Invariant Face Recognition [94.96686189033869]
本稿では,3次元モデルを用いたドメイン転送型顔強調ネットワーク(DotFAN)を提案する。
DotFANは、他のドメインから収集された既存のリッチフェイスデータセットから抽出された知識に基づいて、入力顔の一連の変種を生成することができる。
実験によると、DotFANは、クラス内の多様性を改善するために、小さな顔データセットを増やすのに有益である。
論文 参考訳(メタデータ) (2020-02-23T08:16:34Z) - Deep Multi-task Multi-label CNN for Effective Facial Attribute
Classification [53.58763562421771]
DMM-CNN(ディープ・マルチタスク・マルチラベル・CNN)による効果的な顔属性分類(FAC)を提案する。
具体的には、DMM-CNNは、2つの密接に関連するタスク(顔のランドマーク検出とFAC)を共同で最適化し、マルチタスク学習を活用することにより、FACの性能を向上させる。
2つの異なるネットワークアーキテクチャは2つの属性のグループの特徴を抽出するために設計され、トレーニング中に各顔属性に損失重みを自動的に割り当てる新しい動的重み付け方式が提案されている。
論文 参考訳(メタデータ) (2020-02-10T12:34:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。