論文の概要: SD-GAN: Structural and Denoising GAN reveals facial parts under
occlusion
- arxiv url: http://arxiv.org/abs/2002.08448v1
- Date: Wed, 19 Feb 2020 21:12:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-30 13:54:17.704269
- Title: SD-GAN: Structural and Denoising GAN reveals facial parts under
occlusion
- Title(参考訳): SD-GAN:GANの構造とデノイングが顔の部分の閉塞を明らかに
- Authors: Samik Banerjee, Sukhendu Das
- Abstract要約: 咬合状態にある顔の欠損部分を再構成する生成モデルを提案する。
GAN(Generative Adversarial Network)モデルとして,2モーダルな相互排他的学習アルゴリズムを考案した。
提案手法は,顔認識の性能向上においても,競合する手法よりもかなり優れている。
- 参考スコア(独自算出の注目度): 7.284661356980246
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Certain facial parts are salient (unique) in appearance, which substantially
contribute to the holistic recognition of a subject. Occlusion of these salient
parts deteriorates the performance of face recognition algorithms. In this
paper, we propose a generative model to reconstruct the missing parts of the
face which are under occlusion. The proposed generative model (SD-GAN)
reconstructs a face preserving the illumination variation and identity of the
face. A novel adversarial training algorithm has been designed for a bimodal
mutually exclusive Generative Adversarial Network (GAN) model, for faster
convergence. A novel adversarial "structural" loss function is also proposed,
comprising of two components: a holistic and a local loss, characterized by
SSIM and patch-wise MSE. Ablation studies on real and synthetically occluded
face datasets reveal that our proposed technique outperforms the competing
methods by a considerable margin, even for boosting the performance of Face
Recognition.
- Abstract(参考訳): ある顔の部分の外観は健全(一様)であり、対象の全体的認識に大きく寄与する。
これらのサリエント部分のオクルージョンは、顔認識アルゴリズムの性能を低下させる。
本稿では,咬合状態にある顔の欠損部を再構成するための生成モデルを提案する。
提案した生成モデル (SD-GAN) は, 顔の照明変化と同一性を保持する顔の再構成を行う。
2モーダルな相互排他的GAN(Generative Adversarial Network)モデルに対して,より高速なコンバージェンスのために,新たな逆数学習アルゴリズムが設計された。
また,SSIM とパッチワイズ MSE の2つの成分からなる,新たな対向的「構造的損失関数」も提案されている。
実・合成隠蔽顔データセットのアブレーション研究により,提案手法は,顔認識の性能向上においても,競合する手法よりもかなり優れていたことが明らかとなった。
関連論文リスト
- End2End Occluded Face Recognition by Masking Corrupted Features [82.27588990277192]
最先端の一般的な顔認識モデルは、隠蔽された顔画像に対してうまく一般化しない。
本稿では,1つのエンドツーエンドのディープニューラルネットワークに基づいて,オクルージョンに頑健な新しい顔認識手法を提案する。
我々のアプローチは、深い畳み込みニューラルネットワークから破損した特徴を発見し、動的に学習されたマスクによってそれらをきれいにする。
論文 参考訳(メタデータ) (2021-08-21T09:08:41Z) - Dynamic Facial Expression Recognition under Partial Occlusion with
Optical Flow Reconstruction [20.28462460359439]
本研究では,光フロー領域における顔面の閉塞部分を再構成するためのスキップ接続を備えた自動エンコーダに基づく新しいソリューションを提案する。
提案手法は,オクルード状態と非オクルード状態の間における認識精度の差を著しく低減することを示す。
論文 参考訳(メタデータ) (2020-12-24T12:28:47Z) - Face Hallucination via Split-Attention in Split-Attention Network [58.30436379218425]
畳み込みニューラルネットワーク(CNN)は、顔幻覚を促進するために広く用いられている。
顔の全体像とテクスチャの細部を同時に考慮し,新たな内部分割注意グループ(ESAG)を提案する。
これら2つの経路から特徴を融合させることにより、顔の構造の整合性と顔の詳細の忠実度が強化される。
論文 参考訳(メタデータ) (2020-10-22T10:09:31Z) - Implicit Subspace Prior Learning for Dual-Blind Face Restoration [66.67059961379923]
新しい暗黙的サブスペース事前学習(ISPL)フレームワークが、二重盲顔復元の一般的な解決策として提案されている。
実験の結果,既存の最先端手法に対するISPLの認識歪改善が顕著であった。
論文 参考訳(メタデータ) (2020-10-12T08:04:24Z) - On Improving the Generalization of Face Recognition in the Presence of
Occlusions [13.299431908881425]
Occlusion-aware face RecOgnition (OREO) アプローチは, 咬合の有無に関わらず, 識別的顔テンプレートを学習した。
OREOは、顔認識の一般化能力を1画像ベースで(10.17%)改善した。
論文 参考訳(メタデータ) (2020-06-11T20:17:23Z) - Occlusion-Adaptive Deep Network for Robust Facial Expression Recognition [56.11054589916299]
本研究では,隠蔽領域から腐敗した特徴を発見・破棄するためのランドマーク誘導型アテンションブランチを提案する。
注意マップが最初に作成され、特定の顔部が閉鎖されているかどうかを示し、我々のモデルを非閉鎖領域に誘導する。
これにより、顔が部分的に隠されている場合でも、表情認識システムが回復することができる。
論文 参考訳(メタデータ) (2020-05-12T20:42:55Z) - Dual-Attention GAN for Large-Pose Face Frontalization [59.689836951934694]
本稿では,フォトリアリスティック顔フロンダル化のためのDA-GAN(Dual-Attention Generative Adversarial Network)を提案する。
具体的には、ローカル機能と長距離依存関係を統合するために、自己アテンションベースのジェネレータが導入された。
顔領域の局所的特徴を強調するために,新しい顔認識に基づく識別器を適用した。
論文 参考訳(メタデータ) (2020-02-17T20:00:56Z) - Joint Deep Learning of Facial Expression Synthesis and Recognition [97.19528464266824]
顔表情の合成と認識を効果的に行うための新しい統合深層学習法を提案する。
提案手法は, 2段階の学習手順を伴い, まず, 表情の異なる顔画像を生成するために, 表情合成生成対向ネットワーク (FESGAN) を事前訓練する。
実画像と合成画像間のデータバイアスの問題を軽減するために,新しい実データ誘導バックプロパゲーション(RDBP)アルゴリズムを用いたクラス内損失を提案する。
論文 参考訳(メタデータ) (2020-02-06T10:56:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。