論文の概要: Improving Face-Based Age Estimation with Attention-Based Dynamic Patch
Fusion
- arxiv url: http://arxiv.org/abs/2112.10167v1
- Date: Sun, 19 Dec 2021 15:15:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-21 16:34:04.561255
- Title: Improving Face-Based Age Estimation with Attention-Based Dynamic Patch
Fusion
- Title(参考訳): 注意型動的パッチ融合による顔の年齢推定の改善
- Authors: Haoyi Wang, Victor Sanchez, Chang-Tsun Li
- Abstract要約: ADPF(Attention-based Dynamic Patch Fusion)と呼ばれる顔に基づく年齢推定フレームワークを提案する。
ADPFは、新しいランキング誘導マルチヘッドハイブリッドアテンション(RMHHA)機構を用いて、年齢別パッチを動的に特定・ランク付けする。
提案フレームワークは,いくつかの年齢推定ベンチマークデータセットにおいて,最先端の手法よりも優れている。
- 参考スコア(独自算出の注目度): 32.775902063002604
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: With the increasing popularity of convolutional neural networks (CNNs),
recent works on face-based age estimation employ these networks as the
backbone. However, state-of-the-art CNN-based methods treat each facial region
equally, thus entirely ignoring the importance of some facial patches that may
contain rich age-specific information. In this paper, we propose a face-based
age estimation framework, called Attention-based Dynamic Patch Fusion (ADPF).
In ADPF, two separate CNNs are implemented, namely the AttentionNet and the
FusionNet. The AttentionNet dynamically locates and ranks age-specific patches
by employing a novel Ranking-guided Multi-Head Hybrid Attention (RMHHA)
mechanism. The FusionNet uses the discovered patches along with the facial
image to predict the age of the subject. Since the proposed RMHHA mechanism
ranks the discovered patches based on their importance, the length of the
learning path of each patch in the FusionNet is proportional to the amount of
information it carries (the longer, the more important). ADPF also introduces a
novel diversity loss to guide the training of the AttentionNet and reduce the
overlap among patches so that the diverse and important patches are discovered.
Through extensive experiments, we show that our proposed framework outperforms
state-of-the-art methods on several age estimation benchmark datasets.
- Abstract(参考訳): 畳み込みニューラルネットワーク(CNN)の普及に伴い、顔に基づく年齢推定に関する最近の研究は、これらのネットワークをバックボーンとして採用している。
しかし、最先端のcnnベースの方法は、それぞれの顔領域を等しく扱うため、年齢固有の情報を含むいくつかの顔パッチの重要性を完全に無視する。
本稿では,注意に基づく動的パッチ融合(adpf)と呼ばれる顔に基づく年齢推定フレームワークを提案する。
ADPFでは、AttentionNetとFusionNetという2つの別々のCNNが実装されている。
AttentionNetは、Ring-Guided Multi-Head Hybrid Attention (RMHHA)メカニズムを用いて、年齢別パッチを動的に見つけ、ランク付けする。
FusionNetは、発見したパッチと顔画像を使って被験者の年齢を予測する。
提案するrmhha機構は,その重要度に基づいて検出されたパッチを分類するので,フュージョンネット内の各パッチの学習経路の長さは,その情報量に比例する(長ければ長いほど重要)。
ADPFはまた、AttentionNetのトレーニングをガイドし、パッチ間の重複を減らし、多様な重要なパッチを発見するために、新しい多様性損失を導入した。
提案手法は,様々な年齢推定ベンチマークデータセットにおいて最先端手法よりも優れていることを示す。
関連論文リスト
- A Demographic Attribute Guided Approach to Age Estimation [4.215251065887862]
本研究は,顔属性の補助情報を活用し,属性誘導モジュールを用いた新しい年齢推定手法を提案する。
UTKFace, LAP2016, Morphの3つの公開データセットによる実験結果から, 提案手法は, 他の最先端手法と比較して優れた性能が得られることが示された。
論文 参考訳(メタデータ) (2022-05-20T15:34:47Z) - Visual Attention Emerges from Recurrent Sparse Reconstruction [82.78753751860603]
本稿では,人間の視覚的注意機構の2つの特徴,すなわち再発と空間性に基づく新しい注意形態について述べる。
自己注意は単一ステップの最適化と空間制約のないVARSの特殊な場合であることを示す。
VARSは、一般的な視覚変換器における自己注意の代替として容易に利用でき、様々なベンチマークでその堅牢性を一貫して改善することができる。
論文 参考訳(メタデータ) (2022-04-23T00:35:02Z) - CTCNet: A CNN-Transformer Cooperation Network for Face Image
Super-Resolution [64.06360660979138]
超解像課題に対する効率的なCNN-Transformer Cooperation Network (CTCNet)を提案する。
本稿ではまず,FSAUとTransformerブロックから構成されるLGCM(Local-Global Feature Cooperation Module)を考案した。
次に、エンコードされた機能を強化するために、効率的な機能リファインメントモジュール(FRM)を設計する。
論文 参考訳(メタデータ) (2022-04-19T06:38:29Z) - Avoiding Overfitting: A Survey on Regularization Methods for
Convolutional Neural Networks [0.0]
畳み込みニューラルネットワーク(CNN)により、画像処理タスクが大幅に改善されている。
トレーニングにおける重要な要素は、ネットワークの正規化であり、構造が過度に適合することを防ぐ。
この研究は、過去数年間に開発されたいくつかの正規化手法を分析し、異なるCNNモデルの大幅な改善を示す。
論文 参考訳(メタデータ) (2022-01-10T11:54:06Z) - Keypoint Message Passing for Video-based Person Re-Identification [106.41022426556776]
ビデオベースの人物再識別(re-ID)は、異なるカメラで捉えた人々のビデオスニペットをマッチングすることを目的とした、視覚監視システムにおいて重要な技術である。
既存の手法は主に畳み込みニューラルネットワーク(CNN)に基づいており、そのビルディングブロックは近隣のピクセルを一度に処理するか、あるいは3D畳み込みが時間情報のモデル化に使用される場合、人の動きによって生じるミスアライメントの問題に悩まされる。
本稿では,人間指向グラフ法を用いて,通常の畳み込みの限界を克服することを提案する。具体的には,人手指のキーポイントに位置する特徴を抽出し,時空間グラフとして接続する。
論文 参考訳(メタデータ) (2021-11-16T08:01:16Z) - Distract Your Attention: Multi-head Cross Attention Network for Facial
Expression Recognition [4.500212131331687]
本稿では,DAN(Distract your Attention Network)と呼ばれる新しい表情認識ネットワークを提案する。
本手法は2つの重要な観察結果に基づいており、複数のクラスが本質的に類似した顔の外観を共有しており、その違いは微妙である可能性がある。
特徴クラスタリングネットワーク(FCN)、マルチヘッドクロスアテンションネットワーク(MAN)、アテンションフュージョンネットワーク(AFN)の3つの主要コンポーネントでDANを提案する。
論文 参考訳(メタデータ) (2021-09-15T13:15:54Z) - Hierarchical Attention-based Age Estimation and Bias Estimation [16.335191345543063]
顔画像に基づく年齢推定のための新しい深層学習手法を提案する。
提案手法は,現代的スキームを上回り,新しい最先端の年齢推定精度を提供する。
論文 参考訳(メタデータ) (2021-03-17T19:41:34Z) - PFA-GAN: Progressive Face Aging with Generative Adversarial Network [19.45760984401544]
本論文では,PFA-GANを基盤とした新しい顔老化フレームワークを提案する。
このフレームワークは、蓄積されたアーティファクトと曖昧さを取り除くために、エンドツーエンドでトレーニングすることができる。
実験により,既存の (c) GANs 法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2020-12-07T05:45:13Z) - Regularized Densely-connected Pyramid Network for Salient Instance
Segmentation [73.17802158095813]
我々は、エンドツーエンドの有能なインスタンスセグメンテーション(SIS)のための新しいパイプラインを提案する。
ディープネットワークにおけるリッチな特徴階層をよりよく活用するために、正規化された高密度接続を提案する。
マスク予測を改善するために,新しいマルチレベルRoIAlignベースのデコーダを導入し,多レベル特徴を適応的に集約する。
論文 参考訳(メタデータ) (2020-08-28T00:13:30Z) - Ventral-Dorsal Neural Networks: Object Detection via Selective Attention [51.79577908317031]
我々はVDNet(Ventral-Dorsal Networks)と呼ばれる新しいフレームワークを提案する。
人間の視覚システムの構造にインスパイアされた我々は「Ventral Network」と「Dorsal Network」の統合を提案する。
実験の結果,提案手法は最先端の物体検出手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-05-15T23:57:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。