論文の概要: Adaptively Lighting up Facial Expression Crucial Regions via Local
Non-Local Joint Network
- arxiv url: http://arxiv.org/abs/2203.14045v1
- Date: Sat, 26 Mar 2022 10:58:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-29 14:40:11.927376
- Title: Adaptively Lighting up Facial Expression Crucial Regions via Local
Non-Local Joint Network
- Title(参考訳): 局所非局所関節ネットワークによる顔面表情領域のアダプティブライニング
- Authors: Shasha Mao, Guanghui Shi, Shuiping Gou, Dandan Yan, Licheng Jiao, Lin
Xiong
- Abstract要約: 表情認識の特徴学習において, 顔重要領域を適応的に照らすために, 局所的非局所関節ネットワークを提案する。
提案手法は,5つのベンチマークデータセット上での最先端手法と比較して,より競争力のある性能を実現する。
- 参考スコア(独自算出の注目度): 34.91815992233066
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Facial expression recognition (FER) is still one challenging research due to
the small inter-class discrepancy in the facial expression data. In view of the
significance of facial crucial regions for FER, many existing researches
utilize the prior information from some annotated crucial points to improve the
performance of FER. However, it is complicated and time-consuming to manually
annotate facial crucial points, especially for vast wild expression images.
Based on this, a local non-local joint network is proposed to adaptively light
up the facial crucial regions in feature learning of FER in this paper. In the
proposed method, two parts are constructed based on facial local and non-local
information respectively, where an ensemble of multiple local networks are
proposed to extract local features corresponding to multiple facial local
regions and a non-local attention network is addressed to explore the
significance of each local region. Especially, the attention weights obtained
by the non-local network is fed into the local part to achieve the interactive
feedback between the facial global and local information. Interestingly, the
non-local weights corresponding to local regions are gradually updated and
higher weights are given to more crucial regions. Moreover, U-Net is employed
to extract the integrated features of deep semantic information and low
hierarchical detail information of expression images. Finally, experimental
results illustrate that the proposed method achieves more competitive
performance compared with several state-of-the art methods on five benchmark
datasets. Noticeably, the analyses of the non-local weights corresponding to
local regions demonstrate that the proposed method can automatically enhance
some crucial regions in the process of feature learning without any facial
landmark information.
- Abstract(参考訳): 顔表情データにおけるクラス間差が小さいため、顔表情認識(FER)は依然として難しい研究である。
ferの顔面重要領域の重要性の観点から、既存の研究の多くは、ferの性能を改善するためにいくつかの注釈付き重要点からの事前情報を利用する。
しかし、特に広大な野生の表情画像において、顔の重要点を手動でアノテートするのは複雑で時間を要する。
そこで本論文では, FERの特徴学習において, 顔重要領域を適応的に照らすために, 局所非局所関節ネットワークを提案する。
提案手法では,複数の局所ネットワークのアンサンブルを提案し,複数の局所領域に対応する局所特徴を抽出し,非局所注意ネットワークに対処して各局所領域の意義を探索する,顔局所情報と非局所情報に基づいて2つの部分を構築する。
特に、非局所ネットワークによって得られる注意重みを局所部に供給し、顔のグローバル情報と局所情報との対話的なフィードバックを実現する。
興味深いことに、地域に応じた非局所的な重量は徐々に更新され、より重要な領域により高い重量が与えられる。
さらに、u-netを用いて、表情画像の奥行き意味情報と低階層的詳細情報の統合的特徴を抽出する。
最後に,提案手法は,5つのベンチマークデータセットの最先端手法と比較して,より競争力のある性能を実現することを示す。
特筆すべきは, 局所領域に対応する非局所重みの分析により, 顔ランドマーク情報を用いずに, 特徴学習過程において重要な領域を自動拡張できることである。
関連論文リスト
- Region-aware Distribution Contrast: A Novel Approach to Multi-Task Partially Supervised Learning [50.88504784466931]
マルチタスク密度予測にはセマンティックセグメンテーション、深さ推定、表面正規推定が含まれる。
既存のソリューションは通常、グローバルなクロスタスク画像マッチングのためのグローバルなイメージ表現の学習に依存している。
本提案では,ガウス分布を用いた地域表現をモデル化する。
論文 参考訳(メタデータ) (2024-03-15T12:41:30Z) - Region Generation and Assessment Network for Occluded Person
Re-Identification [43.49129366128688]
個人再識別(ReID)は近年,幅広い応用分野において,より重要な役割を担っている。
ほとんどの手法は、ボディ部分の特定やマッチング戦略の活用に外部ツールを活用することで、このような課題に対処する。
人体領域を効果的かつ効率的に検出する領域生成評価ネットワーク(RGANet)を提案する。
論文 参考訳(メタデータ) (2023-09-07T08:41:47Z) - Region-Based Semantic Factorization in GANs [67.90498535507106]
本稿では,任意の画像領域についてGAN(Generative Adversarial Networks)が学習した潜在意味を分解するアルゴリズムを提案する。
適切に定義された一般化されたレイリー商を通して、アノテーションや訓練なしにそのような問題を解く。
様々な最先端のGANモデルに対する実験結果から,本手法の有効性が示された。
論文 参考訳(メタデータ) (2022-02-19T17:46:02Z) - Point-Level Region Contrast for Object Detection Pre-Training [147.47349344401806]
本稿では,物体検出作業のための自己教師付き事前学習手法である点レベル領域コントラストを提案する。
提案手法は,異なる領域から個々の点対を直接抽出することにより,コントラスト学習を行う。
領域ごとの集約表現と比較すると,入力領域の品質の変化に対して,我々のアプローチはより堅牢である。
論文 参考訳(メタデータ) (2022-02-09T18:56:41Z) - An Entropy-guided Reinforced Partial Convolutional Network for Zero-Shot
Learning [77.72330187258498]
エントロピー誘導強化部分畳み込みネットワーク(ERPCNet)を提案する。
ERPCNetは、人間のアノテーションのない意味的関連性と視覚的相関に基づいて、局所性を抽出し、集約する。
グローバルな協力的局所性を動的に発見するだけでなく、ポリシー勾配最適化のためにより高速に収束する。
論文 参考訳(メタデータ) (2021-11-03T11:13:13Z) - Regional Attention Network (RAN) for Head Pose and Fine-grained Gesture
Recognition [9.131161856493486]
本研究では,CNN(Convolutional Neural Network) である RAN (End-to-end textbfRegional Attention Network) を提案する。
我々の領域は1つ以上の連続した細胞から構成されており、HOG(Histogram of Oriented Gradient)ディスクリプタの計算に使用される戦略に適応している。
提案手法は、異なる指標のかなりの差で最先端の手法より優れている。
論文 参考訳(メタデータ) (2021-01-17T10:14:28Z) - Local Context Attention for Salient Object Segmentation [5.542044768017415]
本研究では,一様表現型アーキテクチャで局所強化特徴写像を生成するための新しいローカルコンテキスト注意ネットワーク(LCANet)を提案する。
提案するネットワークでは,粗い予測と大域的コンテキストの間の相関特徴写像を計算し,アテンショナル・コリレーション・フィルタ (ACF) モジュールを導入している。
いくつかの有能なオブジェクトセグメンテーションデータセットに対して総合的な実験を行い、提案したLCANetの最先端手法に対する優れた性能を実証した。
論文 参考訳(メタデータ) (2020-09-24T09:20:06Z) - Each Part Matters: Local Patterns Facilitate Cross-view Geo-localization [54.00111565818903]
クロスビューなジオローカライゼーションは、異なるプラットフォームから同じ地理的ターゲットの画像を見つけることである。
既存の手法は通常、画像センター内の地理的ターゲットの微細な特徴をマイニングすることに集中している。
我々は、文脈情報を活用するために、ローカルパターンネットワーク(LPN)と呼ばれるシンプルで効果的なディープニューラルネットワークを導入する。
論文 参考訳(メタデータ) (2020-08-26T16:06:11Z) - Landmark Guidance Independent Spatio-channel Attention and Complementary
Context Information based Facial Expression Recognition [5.076419064097734]
現代の顔表情認識(FER)アーキテクチャは、注意を定義するためにランドマーク検出器のような外部ソースに依存している。
本研究では,空間的位置当たりのチャネルごとの局所的および大域的注目度を求める FER のエンドツーエンドアーキテクチャを提案する。
提案したモデルのロバスト性と優れた性能は,組込みデータセットと組込みデータセットの両方で実証される。
論文 参考訳(メタデータ) (2020-07-20T17:33:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。