論文の概要: End2End Occluded Face Recognition by Masking Corrupted Features
- arxiv url: http://arxiv.org/abs/2108.09468v1
- Date: Sat, 21 Aug 2021 09:08:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-24 15:48:21.804713
- Title: End2End Occluded Face Recognition by Masking Corrupted Features
- Title(参考訳): マスキングによるエンド2エンドの顔認識
- Authors: Haibo Qiu, Dihong Gong, Zhifeng Li, Wei Liu, Dacheng Tao
- Abstract要約: 最先端の一般的な顔認識モデルは、隠蔽された顔画像に対してうまく一般化しない。
本稿では,1つのエンドツーエンドのディープニューラルネットワークに基づいて,オクルージョンに頑健な新しい顔認識手法を提案する。
我々のアプローチは、深い畳み込みニューラルネットワークから破損した特徴を発見し、動的に学習されたマスクによってそれらをきれいにする。
- 参考スコア(独自算出の注目度): 82.27588990277192
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the recent advancement of deep convolutional neural networks,
significant progress has been made in general face recognition. However, the
state-of-the-art general face recognition models do not generalize well to
occluded face images, which are exactly the common cases in real-world
scenarios. The potential reasons are the absences of large-scale occluded face
data for training and specific designs for tackling corrupted features brought
by occlusions. This paper presents a novel face recognition method that is
robust to occlusions based on a single end-to-end deep neural network. Our
approach, named FROM (Face Recognition with Occlusion Masks), learns to
discover the corrupted features from the deep convolutional neural networks,
and clean them by the dynamically learned masks. In addition, we construct
massive occluded face images to train FROM effectively and efficiently. FROM is
simple yet powerful compared to the existing methods that either rely on
external detectors to discover the occlusions or employ shallow models which
are less discriminative. Experimental results on the LFW, Megaface challenge 1,
RMF2, AR dataset and other simulated occluded/masked datasets confirm that FROM
dramatically improves the accuracy under occlusions, and generalizes well on
general face recognition.
- Abstract(参考訳): 近年の深層畳み込みニューラルネットワークの進歩により、顔認識において大きな進歩が見られた。
しかし、最先端の一般顔認識モデルは、現実のシナリオでよく見られるような、隠蔽された顔画像にうまく当てはまらない。
潜在的な理由は、訓練用の大規模な隠蔽顔データがないことと、閉塞によって引き起こされる破損した特徴に対処するための特定の設計がないことである。
本稿では,1つのエンドツーエンドのディープニューラルネットワークに基づいて,オクルージョンに頑健な新しい顔認識手法を提案する。
私たちのアプローチは(オクルージョンマスクによる顔認識)、深層畳み込みニューラルネットワークから破損した特徴を発見し、動的に学習したマスクによってそれらをきれいにすることを学びます。
さらに,大規模な隠蔽顔画像を構築し,効果的かつ効率的に訓練する。
外部検出器に頼ってオクルージョンを発見する方法や、差別的でない浅いモデルを使う方法に比べれば、より単純だが強力である。
LFW、Megaface Challenge 1, RMF2、ARデータセットおよびその他の擬似隠蔽/マス付きデータセットの実験結果から、オクルージョン下での精度が劇的に向上し、一般的な顔認識でうまく一般化されることを確認した。
関連論文リスト
- OSDFace: One-Step Diffusion Model for Face Restoration [72.5045389847792]
拡散モデルは、顔の修復において顕著な性能を示した。
顔復元のための新しいワンステップ拡散モデルOSDFaceを提案する。
その結果,OSDFaceは現状のSOTA(State-of-the-art)手法を視覚的品質と定量的指標の両方で上回っていることがわかった。
論文 参考訳(メタデータ) (2024-11-26T07:07:48Z) - Seeing through the Mask: Multi-task Generative Mask Decoupling Face
Recognition [47.248075664420874]
現在の一般的な顔認識システムは、隠蔽シーンに遭遇する際の重大な性能劣化に悩まされている。
本稿では,これら2つのタスクを協調的に扱うために,マルチタスクのgEnerative mask dEcoupling Face Recognition (MEER) ネットワークを提案する。
まず,マスクと識別情報を分離する新しいマスクデカップリングモジュールを提案する。
論文 参考訳(メタデータ) (2023-11-20T03:23:03Z) - Latent-OFER: Detect, Mask, and Reconstruct with Latent Vectors for
Occluded Facial Expression Recognition [0.0]
提案手法は, 顔の隠蔽部分を, 隠蔽されていないかのように検出し, 認識し, FER精度を向上する。
まず、視覚変換器(ViT)ベースのオクルージョンパッチ検出器は、隠蔽されたパッチから潜在ベクトルのみを訓練することで、隠蔽された位置をマスクする。
第2に、ハイブリッド再構成ネットワークは、ViTと畳み込みニューラルネットワーク(CNN)を用いて、完全な画像としてマスキング位置を生成する。
最後に、式関連潜時ベクトル抽出器は、CNNに基づくクラスアクティベーションマップを適用して、すべての潜時ベクトルから式関連情報を検索し、使用する。
論文 参考訳(メタデータ) (2023-07-21T07:56:32Z) - FaceOcc: A Diverse, High-quality Face Occlusion Dataset for Human Face
Extraction [3.8502825594372703]
隠蔽は野生の顔画像にしばしば発生し、ランドマーク検出や3D再構成、顔認識といった顔関連の課題に悩まされる。
本稿では,CelebA本社とインターネットから手動で顔の隠蔽をラベル付けした新しい顔のセグメンテーションデータセットを提案する。
簡単な顔分割モデルの訓練を行ったが,SOTA性能が得られ,提案したデータセットの有効性を実証した。
論文 参考訳(メタデータ) (2022-01-20T19:44:18Z) - Towards NIR-VIS Masked Face Recognition [47.00916333095693]
近赤外可視(NIR-VIS)顔認識は異種顔認識において最も一般的な症例である。
2つのドメインの顔表現で共有される相互情報を最大化するための新しいトレーニング手法を提案する。
さらに、既存のNIR画像からマスク面を合成するために、3次元顔再構成に基づくアプローチを用いる。
論文 参考訳(メタデータ) (2021-04-14T10:40:09Z) - When Face Recognition Meets Occlusion: A New Benchmark [37.616211206620854]
擬似閉塞顔認識データセットを作成します。
対象は10,575人の顔画像804,704枚。
私たちのデータセットは最先端のものを大幅に上回ります。
論文 参考訳(メタデータ) (2021-03-04T03:07:42Z) - Face Hallucination via Split-Attention in Split-Attention Network [58.30436379218425]
畳み込みニューラルネットワーク(CNN)は、顔幻覚を促進するために広く用いられている。
顔の全体像とテクスチャの細部を同時に考慮し,新たな内部分割注意グループ(ESAG)を提案する。
これら2つの経路から特徴を融合させることにより、顔の構造の整合性と顔の詳細の忠実度が強化される。
論文 参考訳(メタデータ) (2020-10-22T10:09:31Z) - Exploiting Semantics for Face Image Deblurring [121.44928934662063]
本稿では,深層畳み込みニューラルネットワークによる意味的手がかりを利用して,効果的かつ効率的な顔分解アルゴリズムを提案する。
顔のセマンティックラベルを入力先として組み込んで,顔の局所構造を正規化するための適応的構造損失を提案する。
提案手法は、より正確な顔の特徴と細部を持つシャープ画像を復元する。
論文 参考訳(メタデータ) (2020-01-19T13:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。