論文の概要: Occlusion-Aware Deep Convolutional Neural Network via Homogeneous
Tanh-transforms for Face Parsing
- arxiv url: http://arxiv.org/abs/2308.15323v1
- Date: Tue, 29 Aug 2023 14:20:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-30 13:55:42.657419
- Title: Occlusion-Aware Deep Convolutional Neural Network via Homogeneous
Tanh-transforms for Face Parsing
- Title(参考訳): 顔解析のための均質タン変換による閉塞型深部畳み込みニューラルネットワーク
- Authors: Weihua Liu, Chaochao Lin, Haoping Yu, Said Boumaraf, Zhaoqiong Pi
- Abstract要約: 顔解析は、各意味的顔成分に対して画素単位のラベルマップを推論する。
画像の照明理論に触発されて,画像前処理のための新しい均一なタン変換を提案する。
本稿では,隠蔽顔解析のためのオクルージョン対応畳み込みニューラルネットワークを提案する。
- 参考スコア(独自算出の注目度): 0.5437298646956507
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Face parsing infers a pixel-wise label map for each semantic facial
component. Previous methods generally work well for uncovered faces, however
overlook the facial occlusion and ignore some contextual area outside a single
face, especially when facial occlusion has become a common situation during the
COVID-19 epidemic. Inspired by the illumination theory of image, we propose a
novel homogeneous tanh-transforms for image preprocessing, which made up of
four tanh-transforms, that fuse the central vision and the peripheral vision
together. Our proposed method addresses the dilemma of face parsing under
occlusion and compresses more information of surrounding context. Based on
homogeneous tanh-transforms, we propose an occlusion-aware convolutional neural
network for occluded face parsing. It combines the information both in
Tanh-polar space and Tanh-Cartesian space, capable of enhancing receptive
fields. Furthermore, we introduce an occlusion-aware loss to focus on the
boundaries of occluded regions. The network is simple and flexible, and can be
trained end-to-end. To facilitate future research of occluded face parsing, we
also contribute a new cleaned face parsing dataset, which is manually purified
from several academic or industrial datasets, including CelebAMask-HQ,
Short-video Face Parsing as well as Helen dataset and will make it public.
Experiments demonstrate that our method surpasses state-of-art methods of face
parsing under occlusion.
- Abstract(参考訳): 顔解析は、各意味的顔成分のピクセル単位のラベルマップを推論する。
しかし、特に新型コロナウイルスの流行で顔の閉塞が一般的な状況になった場合、顔の閉塞を見逃し、単一の顔の外のいくつかの文脈的領域を無視している。
画像の照明理論に着想を得て,中心視と周辺視を融合させる4つのタン変換からなる,画像前処理のための新しい均一タン変換を提案する。
提案手法は咬合下の顔解析のジレンマに対処し,周辺状況のさらなる情報を圧縮する。
均質なtanh変換に基づいて,隠蔽顔解析のためのオクルージョン対応畳み込みニューラルネットワークを提案する。
タン・ポーラ空間とタン・カルテシアン空間の両方で情報を結合し、受容場を拡張できる。
さらに,閉塞領域の境界に焦点を合わせるために,閉塞認識損失を導入する。
ネットワークはシンプルで柔軟性があり、エンドツーエンドでトレーニングできる。
このデータセットは、CelebAMask-HQ、Short-Video Face Parsing、およびHelenデータセットを含むいくつかの学術的または産業的なデータセットから手動で精製され、公開されます。
実験により, 咬合下の顔解析の最先端手法を超越することを示す。
関連論文リスト
- CLR-Face: Conditional Latent Refinement for Blind Face Restoration Using
Score-Based Diffusion Models [57.9771859175664]
最近の生成優先法は、有望なブラインドフェイス修復性能を示している。
入力に忠実なきめ細かい顔の詳細を生成することは、依然として難しい問題である。
本稿では,VQGANアーキテクチャの内部に拡散型プライマーを導入し,非破壊な潜伏埋め込みにおける分布の学習に重点を置いている。
論文 参考訳(メタデータ) (2024-02-08T23:51:49Z) - FaceOcc: A Diverse, High-quality Face Occlusion Dataset for Human Face
Extraction [3.8502825594372703]
隠蔽は野生の顔画像にしばしば発生し、ランドマーク検出や3D再構成、顔認識といった顔関連の課題に悩まされる。
本稿では,CelebA本社とインターネットから手動で顔の隠蔽をラベル付けした新しい顔のセグメンテーションデータセットを提案する。
簡単な顔分割モデルの訓練を行ったが,SOTA性能が得られ,提案したデータセットの有効性を実証した。
論文 参考訳(メタデータ) (2022-01-20T19:44:18Z) - Segmentation-Reconstruction-Guided Facial Image De-occlusion [48.952656891182826]
隠蔽は野生の顔画像で非常に一般的であり、顔関連タスクの劣化パフォーマンスに繋がる。
本稿では,顔分割と3次元顔再構成に基づく新しい顔除去モデルを提案する。
論文 参考訳(メタデータ) (2021-12-15T10:40:08Z) - Unconstrained Face Sketch Synthesis via Perception-Adaptive Network and
A New Benchmark [16.126100433405398]
顔領域と顔成分を正確に知覚することは、制約のないスケッチ合成に不可欠である、と我々は主張する。
本研究では,制約のない条件下で高品質な顔スケッチを生成できる新しい知覚適応ネットワーク(PANet)を提案する。
WildSketchと呼ばれる新しいベンチマークは、800対の顔写真スケッチを含み、ポーズ、表現、民族的起源、背景、照明に大きなバリエーションがある。
論文 参考訳(メタデータ) (2021-12-02T07:08:31Z) - End2End Occluded Face Recognition by Masking Corrupted Features [82.27588990277192]
最先端の一般的な顔認識モデルは、隠蔽された顔画像に対してうまく一般化しない。
本稿では,1つのエンドツーエンドのディープニューラルネットワークに基づいて,オクルージョンに頑健な新しい顔認識手法を提案する。
我々のアプローチは、深い畳み込みニューラルネットワークから破損した特徴を発見し、動的に学習されたマスクによってそれらをきれいにする。
論文 参考訳(メタデータ) (2021-08-21T09:08:41Z) - RoI Tanh-polar Transformer Network for Face Parsing in the Wild [50.8865921538953]
顔解析は、画像中のターゲット顔の顔成分のピクセルワイズラベルを予測することを目的としている。
既存のアプローチは通常、前処理中に計算されたバウンディングボックスに関して、入力画像からターゲット顔を取得する。
本稿では,画像全体を顔領域とコンテキストの固定比でTanh極表現に変換するRoI Tanh極変換を提案する。
第3に、Tanh極空間とTanh-Cartesian空間の両方に畳み込み層を含むハイブリッド残差表現学習ブロック、HybridBlockを提案する。
論文 参考訳(メタデータ) (2021-02-04T16:25:26Z) - Dynamic Facial Expression Recognition under Partial Occlusion with
Optical Flow Reconstruction [20.28462460359439]
本研究では,光フロー領域における顔面の閉塞部分を再構成するためのスキップ接続を備えた自動エンコーダに基づく新しいソリューションを提案する。
提案手法は,オクルード状態と非オクルード状態の間における認識精度の差を著しく低減することを示す。
論文 参考訳(メタデータ) (2020-12-24T12:28:47Z) - Face Forgery Detection by 3D Decomposition [72.22610063489248]
顔画像は、基礎となる3次元幾何学と照明環境の介入の産物とみなす。
顔画像を3次元形状、共通テクスチャ、アイデンティティテクスチャ、周囲光、そして直接光に切り離すことで、悪魔は直接光とアイデンティティテクスチャの中に横たわる。
直接光と識別テクスチャを組み合わせた顔のディテールを,微妙な偽造パターンを検出する手がかりとして活用することを提案する。
論文 参考訳(メタデータ) (2020-11-19T09:25:44Z) - Exploiting Semantics for Face Image Deblurring [121.44928934662063]
本稿では,深層畳み込みニューラルネットワークによる意味的手がかりを利用して,効果的かつ効率的な顔分解アルゴリズムを提案する。
顔のセマンティックラベルを入力先として組み込んで,顔の局所構造を正規化するための適応的構造損失を提案する。
提案手法は、より正確な顔の特徴と細部を持つシャープ画像を復元する。
論文 参考訳(メタデータ) (2020-01-19T13:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。