論文の概要: Fast and Accurate: Structure Coherence Component for Face Alignment
- arxiv url: http://arxiv.org/abs/2006.11697v1
- Date: Sun, 21 Jun 2020 02:52:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-18 12:14:59.486498
- Title: Fast and Accurate: Structure Coherence Component for Face Alignment
- Title(参考訳): 高速かつ正確な顔アライメントのための構造コヒーレンスコンポーネント
- Authors: Beier Zhu, Chunze Lin, Quan Wang, Renjie Liao, Chen Qian
- Abstract要約: 顔のランドマーク間の関係を明示的に考慮する構造コヒーレンス成分を提案する。
我々のアプローチは特に、COFWデータセットとWFLWデータセットにおいて、驚くほど低い失敗率(0%と2.88%)をもたらす挑戦的なケースに対して堅牢である。
- 参考スコア(独自算出の注目度): 34.431092494907666
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a fast and accurate coordinate regression method
for face alignment. Unlike most existing facial landmark regression methods
which usually employ fully connected layers to convert feature maps into
landmark coordinate, we present a structure coherence component to explicitly
take the relation among facial landmarks into account. Due to the geometric
structure of human face, structure coherence between different facial parts
provides important cues for effectively localizing facial landmarks. However,
the dense connection in the fully connected layers overuses such coherence,
making the important cues unable to be distinguished from all connections.
Instead, our structure coherence component leverages a dynamic sparse graph
structure to passing features among the most related landmarks. Furthermore, we
propose a novel objective function, named Soft Wing loss, to improve the
accuracy. Extensive experiments on three popular benchmarks, including WFLW,
COFW and 300W, demonstrate the effectiveness of the proposed method, achieving
state-of-the-art performance with fast speed. Our approach is especially robust
to challenging cases resulting in impressively low failure rate (0% and 2.88%)
in COFW and WFLW datasets.
- Abstract(参考訳): 本稿では,顔アライメントのための高速かつ正確な座標回帰法を提案する。
特徴写像をランドマーク座標に変換するために、通常は完全に連結された層を用いる既存の顔ランドマーク回帰法とは異なり、顔ランドマーク間の関係を明示的に考慮する構造コヒーレンス成分を提示する。
ヒトの顔の幾何学的構造のため、異なる顔部分間の構造的コヒーレンスは、顔のランドマークを効果的に位置づけするための重要な手がかりとなる。
しかし、完全連結層における密接な接続はそのようなコヒーレンスを過大に利用し、すべての接続と区別できない重要な手がかりとなる。
その代わり、我々の構造コヒーレンス成分は、動的スパースグラフ構造を利用して、最も関連するランドマークの中で特徴を渡す。
さらに, 精度を向上させるために, ソフトウイング損失と呼ばれる新しい目的関数を提案する。
WFLW, COFW, 300W の3つのベンチマークにおいて, 提案手法の有効性を実証し, 高速で最先端性能を実現する。
当社のアプローチは,cofwおよびwflwデータセットにおいて,極めて低い障害率(0%と2.88%)を実現した課題に対して,特に堅牢です。
関連論文リスト
- RePFormer: Refinement Pyramid Transformer for Robust Facial Landmark
Detection [131.1478251760399]
顔のランドマーク検出タスクをピラミッド記憶に沿ったランドマーククエリの精製として定式化する。
具体的には、ピラミッドトランスフォーマーヘッド(PTH)を導入し、ランドマーク間の関係とランドマークとクロススケールコンテキストの間の異種関係の両方を構築する。
動的ランドマークリファインメント(DLR)モジュールは、ランドマークレグレッションをエンドツーエンドのリファインメント手順に分解するために設計されている。
論文 参考訳(メタデータ) (2022-07-08T14:12:26Z) - Sparse Local Patch Transformer for Robust Face Alignment and Landmarks
Inherent Relation Learning [11.150290581561725]
固有関係を学習するためのスパース局所パッチ変換器(S)を提案する。
提案手法は計算量が少なくて最先端のレベルで機能する。
論文 参考訳(メタデータ) (2022-03-13T01:15:23Z) - Reasoning Structural Relation for Occlusion-Robust Facial Landmark
Localization [5.171058506312429]
本稿では,オクルージョン・ロバストなランドマークローカライゼーションのための構造関係ネットワーク(SRN)を提案する。
形状制約を単純に活用する既存の方法とは異なり、提案したSRNは異なる顔成分間の構造的関係を捉えることを目的としている。
提案手法は,隠蔽面とマスク面の優れた性能を実現する。
論文 参考訳(メタデータ) (2021-12-19T08:27:37Z) - Spatio-Temporal Representation Factorization for Video-based Person
Re-Identification [55.01276167336187]
本稿では、re-IDのための時空間表現分解モジュール(STRF)を提案する。
STRFはフレキシブルな新しい計算ユニットであり、re-IDのための既存のほとんどの3D畳み込みニューラルネットワークアーキテクチャと併用することができる。
実験により、STRFは様々なベースラインアーキテクチャの性能を向上し、新しい最先端の成果を示す。
論文 参考訳(メタデータ) (2021-07-25T19:29:37Z) - Progressive Spatio-Temporal Bilinear Network with Monte Carlo Dropout
for Landmark-based Facial Expression Recognition with Uncertainty Estimation [93.73198973454944]
提案手法の性能は, 広く使用されている3つのデータセットで評価される。
ビデオベースの最先端の手法に匹敵するが、複雑さははるかに少ない。
論文 参考訳(メタデータ) (2021-06-08T13:40:30Z) - Multiple Object Tracking with Correlation Learning [16.959379957515974]
本研究では,局所相関モジュールを用いて,対象と周辺環境のトポロジカルな関係をモデル化する。
具体的には,各空間の位置とその文脈の密接な対応を確立し,自己教師付き学習を通じて相関量を明確に制約する。
提案手法は, 相関学習と優れた性能の相関学習の有効性を示し, MOT17では76.5%, IDF1では73.6%の最先端MOTAが得られる。
論文 参考訳(メタデータ) (2021-04-08T06:48:02Z) - An Efficient Multitask Neural Network for Face Alignment, Head Pose
Estimation and Face Tracking [9.39854778804018]
効率的なマルチタスク顔アライメント、顔追跡、頭部ポーズ推定ネットワーク(ATPN)を提案します。
ATPNは従来の最先端手法に比べて性能が向上し、パラメータやFLOPSは少ない。
論文 参考訳(メタデータ) (2021-03-13T04:41:15Z) - Towards Analysis-friendly Face Representation with Scalable Feature and
Texture Compression [113.30411004622508]
普遍的で協調的な視覚情報表現は階層的な方法で実現できることを示す。
ディープニューラルネットワークの強力な生成能力に基づいて、基本特徴層と強化層の間のギャップは、特徴レベルのテクスチャ再構築によってさらに埋められる。
提案するフレームワークの効率を改善するために,ベース層ニューラルネットワークをマルチタスクでトレーニングする。
論文 参考訳(メタデータ) (2020-04-21T14:32:49Z) - Learning Oracle Attention for High-fidelity Face Completion [121.72704525675047]
U-Net構造に基づく顔補完のための包括的フレームワークを設計する。
複数のスケールで顔のテクスチャ間の相関関係を効率よく学習する双対空間アテンションモジュールを提案する。
顔成分の位置を事前の知識として捉え,これらの領域に複数識別器を課す。
論文 参考訳(メタデータ) (2020-03-31T01:37:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。