論文の概要: img2pose: Face Alignment and Detection via 6DoF, Face Pose Estimation
- arxiv url: http://arxiv.org/abs/2012.07791v1
- Date: Mon, 14 Dec 2020 18:26:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-08 14:27:56.505056
- Title: img2pose: Face Alignment and Detection via 6DoF, Face Pose Estimation
- Title(参考訳): img2pose: 6dofによる顔アライメントと顔位置推定
- Authors: Vitor Albiero, Xingyu Chen, Xi Yin, Guan Pang, Tal Hassner
- Abstract要約: 実時間6自由度(6DoF)、3次元顔のポーズ推定を顔検出やランドマークの定位なしで提案する。
AFLW2000-3D と BIWI の試験結果から,本手法は実時間で動作し,SotA (SotA) の顔のポーズ推定に優れることがわかった。
- 参考スコア(独自算出の注目度): 27.114995882459333
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose real-time, six degrees of freedom (6DoF), 3D face pose estimation
without face detection or landmark localization. We observe that estimating the
6DoF rigid transformation of a face is a simpler problem than facial landmark
detection, often used for 3D face alignment. In addition, 6DoF offers more
information than face bounding box labels. We leverage these observations to
make multiple contributions: (a) We describe an easily trained, efficient,
Faster R-CNN--based model which regresses 6DoF pose for all faces in the photo,
without preliminary face detection. (b) We explain how pose is converted and
kept consistent between the input photo and arbitrary crops created while
training and evaluating our model. (c) Finally, we show how face poses can
replace detection bounding box training labels. Tests on AFLW2000-3D and BIWI
show that our method runs at real-time and outperforms state of the art (SotA)
face pose estimators. Remarkably, our method also surpasses SotA models of
comparable complexity on the WIDER FACE detection benchmark, despite not been
optimized on bounding box labels.
- Abstract(参考訳): 実時間6自由度(6自由度)、3次元顔ポーズ推定を顔検出やランドマーク定位なしで提案する。
顔の6DoF剛性変換を推定することは、顔のランドマーク検出よりも簡単な問題であり、しばしば3次元顔アライメントに使用される。
さらに、6DoFはフェイスバウンディングボックスラベルよりも多くの情報を提供する。
a) 予備的な顔検出なしに、6DoFのポーズを写真のすべての顔に反映させる、容易に訓練され、効率的で、より高速なR-CNNベースのモデルを記述する。
b) モデルの訓練および評価中に作成された入力写真と任意の作物の間でポーズがどのように変換・維持されるかを説明する。
(c) 最後に、顔のポーズが検出境界ボックストレーニングラベルを置き換える方法を示す。
AFLW2000-3D と BIWI の試験結果から,本手法は実時間で動作し,SotA (SotA) の顔のポーズ推定に優れることがわかった。
また,本手法は,境界ボックスラベルに最適化されていないにもかかわらず,WIDER FACE検出ベンチマークにおいて同等の複雑性を持つSotAモデルを上回る。
関連論文リスト
- Learning to Estimate 6DoF Pose from Limited Data: A Few-Shot,
Generalizable Approach using RGB Images [60.0898989456276]
本稿では,数ショットの6DoFポーズ推定のためのCas6Dという新しいフレームワークを提案する。
極めて少数の設定で対象物検出の偽陽性に対処するために,本フレームワークでは,自己教師付き事前学習型ViTを用いて,ロバストな特徴表現を学習する。
LINEMODとGenMOPデータセットの実験結果は、Cas6Dが32ショット設定で最先端の手法を9.2%、精度3.8%(Proj-5)で上回ることを示した。
論文 参考訳(メタデータ) (2023-06-13T07:45:42Z) - Towards 3D Face Reconstruction in Perspective Projection: Estimating
6DoF Face Pose from Monocular Image [48.77844225075744]
顔がカメラに非常に近い、あるいはカメラ軸に沿って動くいくつかのシナリオでは、この手法は不正確な再構築と不安定な時間的適合に悩まされる。
深層ニューラルネットワークであるPerspNet(PerspNet)は、標準空間における3次元顔形状を同時に再構築するために提案されている。
我々は、視点投影のシナリオ下での3次元顔再構成ソリューションのトレーニングと評価を可能にするために、大規模なARKitFaceデータセットをコントリビュートする。
論文 参考訳(メタデータ) (2022-05-09T08:49:41Z) - Learning to Aggregate and Personalize 3D Face from In-the-Wild Photo
Collection [65.92058628082322]
非パラメトリックフェースモデリングは形状仮定なしで画像からのみ3次元フェースを再構成することを目的としている。
本稿では,教師なしのロバストな3次元顔モデリングのための学習・アグリゲート・パーソナライズ・フレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-15T03:10:17Z) - Robust Face-Swap Detection Based on 3D Facial Shape Information [59.32489266682952]
顔のスワップ画像やビデオは、悪意ある攻撃者を惹きつけ、重要な人物の信用を損ねている。
以前のピクセルレベルのアーティファクトに基づく検出技術は、常に不明瞭なパターンにフォーカスするが、利用可能なセマンティックなヒントは無視する。
キーフィギュアの顔・スワップ検出のための外観・形状特徴をフル活用するための生体情報に基づく手法を提案する。
論文 参考訳(メタデータ) (2021-04-28T09:35:48Z) - Sub-pixel face landmarks using heatmaps and a bag of tricks [0.0]
顔のランドマークを正確にローカライズするための熱マップ回帰手法を提案する。
顔検出装置から顔の位置と整列に5つのナイーブな顔ランドマークを使用する。
また, デコンボリューション層とピクセルシャッフル層を混合することで, アップスケーリングの複雑さを低減できることを示した。
論文 参考訳(メタデータ) (2021-03-04T14:34:20Z) - Learning an Animatable Detailed 3D Face Model from In-The-Wild Images [50.09971525995828]
本研究では, 実物的詳細と実物的画像から3次元顔レグレッサーを共同学習する第1の手法を提案する。
DECAモデルは、低次元の潜時表現からUV変位マップを堅牢に生成するように訓練されています。
本稿では,人固有の細部と表情依存のしわを区別する新しい細部一貫性損失を提案する。
論文 参考訳(メタデータ) (2020-12-07T19:30:45Z) - DeepFaceFlow: In-the-wild Dense 3D Facial Motion Estimation [56.56575063461169]
DeepFaceFlowは、3D非剛体顔の流れを推定するための堅牢で高速で高精度なフレームワークである。
私たちのフレームワークは、2つの非常に大規模な顔ビデオデータセットでトレーニングされ、テストされました。
登録された画像に対して,60fpsで3次元フローマップを生成する。
論文 参考訳(メタデータ) (2020-05-14T23:56:48Z) - One-Shot GAN Generated Fake Face Detection [3.3707422585608953]
本稿では,汎用的なワンショットGAN生成顔検出手法を提案する。
提案手法は,シーン理解モデルを用いて顔から文脈外オブジェクトを抽出する。
実験の結果,文脈外の特徴の観点から,偽の顔と現実の顔とを識別できることが判明した。
論文 参考訳(メタデータ) (2020-03-27T05:51:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。