論文の概要: AnchorFace: An Anchor-based Facial Landmark Detector Across Large Poses
- arxiv url: http://arxiv.org/abs/2007.03221v3
- Date: Sat, 6 Feb 2021 07:11:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-12 20:01:33.497021
- Title: AnchorFace: An Anchor-based Facial Landmark Detector Across Large Poses
- Title(参考訳): AnchorFace:アンカーをベースとした顔のランドマーク検出装置
- Authors: Zixuan Xu, Banghuai Li, Miao Geng, Ye Yuan
- Abstract要約: 本研究では,大規模なポーズにおける顔のランドマークの局所化問題に対処するための分割・集約戦略を提案する。
提案手法はAnchorFaceと呼ばれ、4つの挑戦的ベンチマークで非常に効率的な推論速度で最先端の結果を得られる。
- 参考スコア(独自算出の注目度): 12.291368376851231
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Facial landmark localization aims to detect the predefined points of human
faces, and the topic has been rapidly improved with the recent development of
neural network based methods. However, it remains a challenging task when
dealing with faces in unconstrained scenarios, especially with large pose
variations. In this paper, we target the problem of facial landmark
localization across large poses and address this task based on a
split-and-aggregate strategy. To split the search space, we propose a set of
anchor templates as references for regression, which well addresses the large
variations of face poses. Based on the prediction of each anchor template, we
propose to aggregate the results, which can reduce the landmark uncertainty due
to the large poses. Overall, our proposed approach, named AnchorFace, obtains
state-of-the-art results with extremely efficient inference speed on four
challenging benchmarks, i.e. AFLW, 300W, Menpo, and WFLW dataset. Code will be
available at https://github.com/nothingelse92/AnchorFace.
- Abstract(参考訳): 顔のランドマークのローカライゼーションは、人間の顔の予め定義された点を検出することを目的としており、最近のニューラルネットワークベースの手法の開発により、トピックは急速に改善されている。
しかし、制約のないシナリオ、特に大きなポーズのバリエーションで顔を扱う場合、これは難しい課題である。
本稿では,大規模ポーズにおける顔のランドマークの局所化問題を対象とし,この課題を分割・集約戦略に基づいて解決する。
探索空間を分割するため、回帰の参照としてアンカーテンプレートのセットを提案し、顔ポーズの大きなバリエーションによく対処する。
それぞれのアンカーテンプレートの予測に基づいて,結果を集約し,大きなポーズによる目立った不確実性を低減することを提案する。
全体として、提案手法はAnchorFaceと呼ばれ、AFLW、300W、Menpo、WFLWデータセットという4つの挑戦的なベンチマークに対して、非常に効率的な推論速度で最先端の結果を得る。
コードはhttps://github.com/nothingelse92/AnchorFaceで入手できる。
関連論文リスト
- GLACE: Global Local Accelerated Coordinate Encoding [66.87005863868181]
シーン座標回帰法は小規模なシーンでは有効であるが、大規模シーンでは重大な課題に直面している。
本研究では,事前学習したグローバルおよびローカルのエンコーディングを統合したGLACEを提案する。
提案手法は,低マップサイズモデルを用いて,大規模シーンにおける最先端結果を実現する。
論文 参考訳(メタデータ) (2024-06-06T17:59:50Z) - COMICS: End-to-end Bi-grained Contrastive Learning for Multi-face Forgery Detection [56.7599217711363]
顔偽造認識法は一度に1つの顔しか処理できない。
ほとんどの顔偽造認識法は一度に1つの顔しか処理できない。
マルチフェイスフォージェリ検出のためのエンドツーエンドフレームワークであるCOMICSを提案する。
論文 参考訳(メタデータ) (2023-08-03T03:37:13Z) - Shape Preserving Facial Landmarks with Graph Attention Networks [3.996275177789895]
本稿では,CNN と Graph Attention Network Regressors のカスケードを組み合わせたモデルを提案する。
顔のランドマークの外観と位置を共同で表現するエンコーディングと、その信頼性に応じて情報を測定するアテンション機構を導入する。
実験により,提案モデルが顔の構造のグローバルな表現を学習し,頭部ポーズとランドマーク推定のベンチマークで最高性能を達成できることが確認された。
論文 参考訳(メタデータ) (2022-10-13T17:58:02Z) - Zoom In and Out: A Mixed-scale Triplet Network for Camouflaged Object
Detection [0.0]
本稿では,不明瞭な画像を観察する際の人間の動作を模倣する混合スケール三重項ネットワークbf ZoomNetを提案する。
具体的には、ZoomNetは、ズーム戦略を用いて、設計されたスケール統合ユニットと階層的な混合スケールユニットによって、差別的な混合スケール意味学を学ぶ。
提案したタスクフレンドリなモデルは、4つの公開データセット上の既存の23の最先端手法を一貫して上回っている。
論文 参考訳(メタデータ) (2022-03-05T09:13:52Z) - Locally Aware Piecewise Transformation Fields for 3D Human Mesh
Registration [67.69257782645789]
本論文では,3次元変換ベクトルを学習し,提案空間内の任意のクエリ点をリザーブ空間内の対応する位置にマップする部分変換場を提案する。
パラメトリックモデルにネットワークのポーズを合わせることで、特に極端なポーズにおいて、より優れた登録品質が得られることを示す。
論文 参考訳(メタデータ) (2021-04-16T15:16:09Z) - Sub-pixel face landmarks using heatmaps and a bag of tricks [0.0]
顔のランドマークを正確にローカライズするための熱マップ回帰手法を提案する。
顔検出装置から顔の位置と整列に5つのナイーブな顔ランドマークを使用する。
また, デコンボリューション層とピクセルシャッフル層を混合することで, アップスケーリングの複雑さを低減できることを示した。
論文 参考訳(メタデータ) (2021-03-04T14:34:20Z) - Deep Structured Prediction for Facial Landmark Detection [59.60946775628646]
本稿では,深層畳み込みネットワークと条件付きランダムフィールドを組み合わせた深層構造顔のランドマーク検出手法を提案する。
顔のランドマーク検出における最先端技術よりも優れた性能を示す。
論文 参考訳(メタデータ) (2020-10-18T17:09:24Z) - Point-Set Anchors for Object Detection, Instance Segmentation and Pose
Estimation [85.96410825961966]
中心点から抽出された画像の特徴は、離れたキーポイントや境界ボックスの境界を予測するための限られた情報を含んでいると論じる。
推論を容易にするために,より有利な位置に配置された点集合からの回帰を行うことを提案する。
我々は、オブジェクト検出、インスタンス分割、人間のポーズ推定にPoint-Set Anchorsと呼ばれるこのフレームワークを適用した。
論文 参考訳(メタデータ) (2020-07-06T15:59:56Z) - A Transfer Learning approach to Heatmap Regression for Action Unit
intensity estimation [50.261472059743845]
アクション・ユニット(英: Action Units、AUs)は、幾何学に基づく原子性顔面筋運動である。
本稿では,その位置と強度を共同で推定する新しいAUモデリング問題を提案する。
ヒートマップは、所定の空間的位置でAUが発生するか否かをモデル化する。
論文 参考訳(メタデータ) (2020-04-14T16:51:13Z) - Multistage Model for Robust Face Alignment Using Deep Neural Networks [8.504539228134082]
空間変換器ネットワーク,時間ガラスネットワーク,および模範的形状制約を利用する多段階モデルを提案する。
提案手法の他の最先端手法よりも優れた性能を示す実験を行った。
論文 参考訳(メタデータ) (2020-02-04T01:13:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。