論文の概要: Locality-aware Channel-wise Dropout for Occluded Face Recognition
- arxiv url: http://arxiv.org/abs/2107.09270v1
- Date: Tue, 20 Jul 2021 05:53:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-21 14:59:12.578474
- Title: Locality-aware Channel-wise Dropout for Occluded Face Recognition
- Title(参考訳): 画像認識のための位置認識型チャネルワイドドロップアウト
- Authors: Mingjie He, Jie Zhang, Shiguang Shan, Xiao Liu, Zhongqin Wu, Xilin
Chen
- Abstract要約: 顔認識は、特に顔が部分的に隠されている場合、制約のないシナリオでは難しいタスクである。
そこで本研究では,ニューロン群の活性化を,精巧に選択されたチャネルに落とすことによって,新しい,エレガントなオクルージョン・シミュレート法を提案する。
種々のベンチマーク実験により,提案手法は最先端の手法よりも優れた性能を示し,性能が向上した。
- 参考スコア(独自算出の注目度): 116.2355331029041
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Face recognition remains a challenging task in unconstrained scenarios,
especially when faces are partially occluded. To improve the robustness against
occlusion, augmenting the training images with artificial occlusions has been
proved as a useful approach. However, these artificial occlusions are commonly
generated by adding a black rectangle or several object templates including
sunglasses, scarfs and phones, which cannot well simulate the realistic
occlusions. In this paper, based on the argument that the occlusion essentially
damages a group of neurons, we propose a novel and elegant occlusion-simulation
method via dropping the activations of a group of neurons in some elaborately
selected channel. Specifically, we first employ a spatial regularization to
encourage each feature channel to respond to local and different face regions.
In this way, the activations affected by an occlusion in a local region are
more likely to be located in a single feature channel. Then, the locality-aware
channel-wise dropout (LCD) is designed to simulate the occlusion by dropping
out the entire feature channel. Furthermore, by randomly dropping out several
feature channels, our method can well simulate the occlusion of larger area.
The proposed LCD can encourage its succeeding layers to minimize the
intra-class feature variance caused by occlusions, thus leading to improved
robustness against occlusion. In addition, we design an auxiliary spatial
attention module by learning a channel-wise attention vector to reweight the
feature channels, which improves the contributions of non-occluded regions.
Extensive experiments on various benchmarks show that the proposed method
outperforms state-of-the-art methods with a remarkable improvement.
- Abstract(参考訳): 顔認識は、特に顔が部分的に隠されている場合、制約のないシナリオでは難しい課題である。
閉塞に対する堅牢性を向上させるため,人工閉塞によるトレーニング画像の増強が有用であることが証明された。
しかしながら、これらの人工閉塞は一般的に、現実的な閉塞を十分にシミュレートできない黒い長方形またはサングラス、スカーフ、電話を含むいくつかのオブジェクトテンプレートを追加することで生成される。
本稿では,神経細胞群を本質的に損傷させるという主張に基づいて,ニューロン群の活性化を精巧に選択したチャネルに落とすことによって,新規でエレガントなオクルージョンシミュレーション法を提案する。
具体的には、まず、各特徴チャネルが局所的および異なる顔領域に応答するように促すために、空間正規化を用いる。
このようにして、局所領域の閉塞によって影響を受ける活性化は、単一の特徴チャネルにある可能性が高い。
次に、局所性認識チャネルワイズドロップアウト(lcd)は、機能チャネル全体をドロップアウトして閉塞をシミュレートするように設計されている。
さらに,複数の特徴チャネルをランダムに削除することで,より広い領域の閉塞をシミュレートすることができる。
提案したLCDは, 閉塞によるクラス内特徴分散を最小限に抑え, 閉塞に対する堅牢性を向上させることができる。
さらに,特徴チャネルの重み付けを行うために,チャネル毎の注意ベクトルを学習することで補助空間的注意モジュールを設計し,非閉塞領域の寄与度を向上させる。
様々なベンチマーク実験により,提案手法は最先端の手法よりも優れた性能を発揮した。
関連論文リスト
- Robust Network Learning via Inverse Scale Variational Sparsification [55.64935887249435]
時間連続な逆スケール空間の定式化において、逆スケールの変動スペーサー化フレームワークを導入する。
周波数ベースの手法とは異なり、我々の手法は小さな特徴を滑らかにすることでノイズを除去するだけでなく、ノイズを除去する。
各種騒音に対する頑健性の向上によるアプローチの有効性を示す。
論文 参考訳(メタデータ) (2024-09-27T03:17:35Z) - Improving Apple Object Detection with Occlusion-Enhanced Distillation [1.0049237739132246]
自然環境で成長するリンゴは、しばしば葉や枝から激しい視覚障害に直面する。
OED(Occlusion-Enhanced Distillation)と呼ばれる手法を導入し、隠蔽データセット上の意味的に整合した特徴の学習を規則化する。
提案手法は, 広範囲な比較実験により, 最先端技術よりも優れていた。
論文 参考訳(メタデータ) (2024-09-03T03:11:48Z) - DPMesh: Exploiting Diffusion Prior for Occluded Human Mesh Recovery [71.6345505427213]
DPMeshは、人間のメッシュリカバリを排除した革新的なフレームワークである。
これは、事前訓練されたテキスト・ツー・イメージ拡散モデルに埋め込まれた対象構造と空間的関係について、より深い拡散に乗じる。
論文 参考訳(メタデータ) (2024-04-01T18:59:13Z) - CLR-Face: Conditional Latent Refinement for Blind Face Restoration Using
Score-Based Diffusion Models [57.9771859175664]
最近の生成優先法は、有望なブラインドフェイス修復性能を示している。
入力に忠実なきめ細かい顔の詳細を生成することは、依然として難しい問題である。
本稿では,VQGANアーキテクチャの内部に拡散型プライマーを導入し,非破壊な潜伏埋め込みにおける分布の学習に重点を置いている。
論文 参考訳(メタデータ) (2024-02-08T23:51:49Z) - Occlusion-Robust FAU Recognition by Mining Latent Space of Masked
Autoencoders [23.39566752915331]
顔面行動単位(FAUs)は、きめ細かい表情解析に重要である。
新しいアプローチは、マスク付きオートエンコーダ(MAE)の潜伏空間からの豊富な情報を活用し、FAU機能に変換する。
FAUは、通常の条件下での最先端の手法と同等の性能を達成できる。
論文 参考訳(メタデータ) (2022-12-08T01:57:48Z) - Self-Supervised Robustifying Guidance for Monocular 3D Face
Reconstruction [14.203990541030445]
本稿では,顔画像の閉塞やノイズに対する堅牢性を得るために,自己改善型RObustifying GUidancE(ROGUE)フレームワークを提案する。
提案ネットワークは,1)クリーン顔の3次元顔係数を得るための誘導パイプラインと,2)隠蔽画像やノイズ画像の推定係数とクリーン顔との整合性を取得するロバスト化パイプラインとを含む。
CelebAのテストデータセットの3つのバリエーションにおいて,本手法は最先端の手法よりも大きなマージンで性能を向上する。
論文 参考訳(メタデータ) (2021-12-29T03:30:50Z) - Dynamic Facial Expression Recognition under Partial Occlusion with
Optical Flow Reconstruction [20.28462460359439]
本研究では,光フロー領域における顔面の閉塞部分を再構成するためのスキップ接続を備えた自動エンコーダに基づく新しいソリューションを提案する。
提案手法は,オクルード状態と非オクルード状態の間における認識精度の差を著しく低減することを示す。
論文 参考訳(メタデータ) (2020-12-24T12:28:47Z) - OccInpFlow: Occlusion-Inpainting Optical Flow Estimation by Unsupervised
Learning [29.802404790103665]
閉塞は、教師なしの光学フロー学習において必然的で重要な問題である。
OccInpFlowはOccclusion領域をフル活用するためのOccclusion-inpaintingフレームワークである。
本研究では,Flying Chairs,KITTI,MPI-Sintelなどの主要なフローベンチマークデータセットについて実験を行った。
論文 参考訳(メタデータ) (2020-06-30T10:01:32Z) - Occlusion-Adaptive Deep Network for Robust Facial Expression Recognition [56.11054589916299]
本研究では,隠蔽領域から腐敗した特徴を発見・破棄するためのランドマーク誘導型アテンションブランチを提案する。
注意マップが最初に作成され、特定の顔部が閉鎖されているかどうかを示し、我々のモデルを非閉鎖領域に誘導する。
これにより、顔が部分的に隠されている場合でも、表情認識システムが回復することができる。
論文 参考訳(メタデータ) (2020-05-12T20:42:55Z) - Non-Local Part-Aware Point Cloud Denoising [55.50360085086123]
本稿では,点群を識別する非局所部分認識ディープニューラルネットワークを提案する。
グラフアテンションモジュールでカスタマイズした非局所学習ユニット(NLU)を設計し、非局所意味論的特徴を適応的にキャプチャする。
雑音発生性能を向上させるため,ノイズ特性をノイズ入力から段階的に抽出するために,一連のNLUをカスケードする。
論文 参考訳(メタデータ) (2020-03-14T13:51:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。