論文の概要: Deep Multi-task Multi-label CNN for Effective Facial Attribute
Classification
- arxiv url: http://arxiv.org/abs/2002.03683v1
- Date: Mon, 10 Feb 2020 12:34:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-02 09:09:09.439196
- Title: Deep Multi-task Multi-label CNN for Effective Facial Attribute
Classification
- Title(参考訳): 効果的な顔属性分類のためのディープマルチタスクマルチラベルCNN
- Authors: Longbiao Mao, Yan Yan, Jing-Hao Xue, and Hanzi Wang
- Abstract要約: DMM-CNN(ディープ・マルチタスク・マルチラベル・CNN)による効果的な顔属性分類(FAC)を提案する。
具体的には、DMM-CNNは、2つの密接に関連するタスク(顔のランドマーク検出とFAC)を共同で最適化し、マルチタスク学習を活用することにより、FACの性能を向上させる。
2つの異なるネットワークアーキテクチャは2つの属性のグループの特徴を抽出するために設計され、トレーニング中に各顔属性に損失重みを自動的に割り当てる新しい動的重み付け方式が提案されている。
- 参考スコア(独自算出の注目度): 53.58763562421771
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Facial Attribute Classification (FAC) has attracted increasing attention in
computer vision and pattern recognition. However, state-of-the-art FAC methods
perform face detection/alignment and FAC independently. The inherent
dependencies between these tasks are not fully exploited. In addition, most
methods predict all facial attributes using the same CNN network architecture,
which ignores the different learning complexities of facial attributes. To
address the above problems, we propose a novel deep multi-task multi-label CNN,
termed DMM-CNN, for effective FAC. Specifically, DMM-CNN jointly optimizes two
closely-related tasks (i.e., facial landmark detection and FAC) to improve the
performance of FAC by taking advantage of multi-task learning. To deal with the
diverse learning complexities of facial attributes, we divide the attributes
into two groups: objective attributes and subjective attributes. Two different
network architectures are respectively designed to extract features for two
groups of attributes, and a novel dynamic weighting scheme is proposed to
automatically assign the loss weight to each facial attribute during training.
Furthermore, an adaptive thresholding strategy is developed to effectively
alleviate the problem of class imbalance for multi-label learning. Experimental
results on the challenging CelebA and LFWA datasets show the superiority of the
proposed DMM-CNN method compared with several state-of-the-art FAC methods.
- Abstract(参考訳): 顔属性分類(FAC)はコンピュータビジョンやパターン認識において注目を集めている。
しかし、最先端のFAC法は、顔検出/アライメントとFACを独立に行う。
これらのタスク間の固有の依存関係は、完全には利用されない。
さらに、ほとんどの方法は、顔属性の異なる学習の複雑さを無視する同じcnnネットワークアーキテクチャを使用して、すべての顔属性を予測する。
上記の問題に対処するため,DMM-CNNと呼ばれる新しいマルチタスクマルチラベルCNNを提案する。
具体的には、DMM-CNNは、2つの密接に関連するタスク(顔のランドマーク検出とFAC)を共同で最適化し、マルチタスク学習を活用することにより、FACの性能を向上させる。
顔属性の多様な学習複雑さに対処するため、属性を目的属性と主観属性の2つのグループに分割する。
2つの異なるネットワークアーキテクチャは2つの属性のグループの特徴を抽出するために設計され、トレーニング中に各顔属性に損失重みを自動的に割り当てる新しい動的重み付け方式が提案されている。
さらに,マルチラベル学習におけるクラス不均衡の問題を効果的に緩和する適応的しきい値設定戦略を開発した。
CelebA と LFWA データセットによる実験結果から,提案した DMM-CNN 法はいくつかの最先端 FAC 法と比較して優れていることが示された。
関連論文リスト
- SwinFace: A Multi-task Transformer for Face Recognition, Expression
Recognition, Age Estimation and Attribute Estimation [60.94239810407917]
本論文では,単一スウィントランスを用いた顔認識,表情認識,年齢推定,顔属性推定のための多目的アルゴリズムを提案する。
複数のタスク間の競合に対処するため、マルチレベルチャネル注意(MLCA)モジュールをタスク固有の分析に統合する。
実験の結果,提案したモデルでは顔の理解が良く,全てのタスクにおいて優れた性能が得られることがわかった。
論文 参考訳(メタデータ) (2023-08-22T15:38:39Z) - PARFormer: Transformer-based Multi-Task Network for Pedestrian Attribute
Recognition [23.814762073093153]
4つのモジュールを含むPARFormerという,純粋なトランスフォーマーベースのマルチタスクPARネットワークを提案する。
特徴抽出モジュールでは,特徴抽出のための強力なベースラインを構築し,複数のPARベンチマークで競合する結果を得る。
視点認識モジュールでは、歩行者属性に対する視点の影響を探索し、マルチビューのコントラスト損失を提案する。
属性認識モジュールでは、負の正の不均衡問題を緩和し、属性予測を生成する。
論文 参考訳(メタデータ) (2023-04-14T16:27:56Z) - TransFA: Transformer-based Representation for Face Attribute Evaluation [87.09529826340304]
我々はtextbfTransFA を用いたtextbfattribute 評価のための新しい textbf Transformer 表現を提案する。
提案するTransFAは,最先端手法と比較して優れた性能を示す。
論文 参考訳(メタデータ) (2022-07-12T10:58:06Z) - Universal Representations: A Unified Look at Multiple Task and Domain
Learning [37.27708297562079]
本稿では,複数の視覚タスクと視覚領域を共通表現によって統合的に学習することを提案する。
複数の密接な予測問題の学習において、普遍表現が最先端のパフォーマンスを達成することを示す。
また、アブレーションと定性的な研究を通じて複数の分析を行う。
論文 参考訳(メタデータ) (2022-04-06T11:40:01Z) - Tasks Structure Regularization in Multi-Task Learning for Improving
Facial Attribute Prediction [27.508755548317712]
我々は、顔属性予測器が他の属性の知識を使ってより優れた一般化性能を得る、新しいMulti-Task Learning(MTL)パラダイムを使用する。
本手法は顔属性予測の競合手法と比較し,その有効性を示す。
論文 参考訳(メタデータ) (2021-07-29T08:38:17Z) - Exploiting Emotional Dependencies with Graph Convolutional Networks for
Facial Expression Recognition [31.40575057347465]
本稿では,視覚における表情認識のためのマルチタスク学習フレームワークを提案する。
MTL設定において、離散認識と連続認識の両方のために共有特徴表現が学習される。
実験の結果,本手法は離散FER上での最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2021-06-07T10:20:05Z) - Semantic Change Detection with Asymmetric Siamese Networks [71.28665116793138]
2つの空中画像が与えられた場合、セマンティックチェンジ検出は、土地被覆のバリエーションを特定し、それらの変化タイプをピクセルワイド境界で識別することを目的としている。
この問題は、正確な都市計画や天然資源管理など、多くの地球ビジョンに関連するタスクにおいて不可欠である。
本研究では, 広く異なる構造を持つモジュールから得られた特徴対を用いて意味変化を同定し, 同定するための非対称システマネットワーク(ASN)を提案する。
論文 参考訳(メタデータ) (2020-10-12T13:26:30Z) - Domain Private and Agnostic Feature for Modality Adaptive Face
Recognition [10.497190559654245]
本稿では,不整合表現モジュール(DRM),特徴融合モジュール(FFM),計量ペナルティ学習セッションを含む特徴集約ネットワーク(FAN)を提案する。
第一に、DRMでは、ドメインに依存しないネットワークとドメインに依存しないネットワークという2つのワークは、モダリティの特徴とアイデンティティの特徴を学習するために特別に設計されている。
第2に、FFMでは、ID特徴をドメイン特徴と融合させて、双方向の双方向ID特徴変換を実現する。
第3に、容易なペアとハードペアの分布不均衡がクロスモーダルデータセットに存在することを考えると、適応性のあるID保存計量学習が可能である。
論文 参考訳(メタデータ) (2020-08-10T00:59:42Z) - Symbiotic Adversarial Learning for Attribute-based Person Search [86.7506832053208]
本稿では,共生学習の枠組みとして,共生学習の基盤に2つのGANを配置する。
具体的には、2種類の生成的敵ネットワークがトレーニングプロセスを通して協調的に学習する。
論文 参考訳(メタデータ) (2020-07-19T07:24:45Z) - Cross-modality Person re-identification with Shared-Specific Feature
Transfer [112.60513494602337]
クロスモダリティの人物再識別(cm-ReID)は、インテリジェントビデオ分析において難しいが重要な技術である。
モーダリティ共有型特徴伝達アルゴリズム (cm-SSFT) を提案し, モーダリティ共有型情報とモーダリティ固有特性の両方のポテンシャルについて検討する。
論文 参考訳(メタデータ) (2020-02-28T00:18:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。