論文の概要: ACR Loss: Adaptive Coordinate-based Regression Loss for Face Alignment
- arxiv url: http://arxiv.org/abs/2203.15835v1
- Date: Tue, 29 Mar 2022 18:08:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-01 06:24:51.158257
- Title: ACR Loss: Adaptive Coordinate-based Regression Loss for Face Alignment
- Title(参考訳): acr損失:適応座標に基づく顔アライメントの回帰損失
- Authors: Ali Pourramezan Fard, Mohammah H. Mahoor
- Abstract要約: 顔アライメントのためのCBRの精度を向上させるために,適応コーディネートベース回帰(ACR)損失を提案する。
ACRロスは、顔の各ランドマークポイントを予測する難易度に基づいて、その曲率と損失の影響を適応的に修正することができる。
顔画像における顔のランドマーク点の予測におけるACRロスの有効性について検討した。
- 参考スコア(独自算出の注目度): 2.538209532048867
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Although deep neural networks have achieved reasonable accuracy in solving
face alignment, it is still a challenging task, specifically when we deal with
facial images, under occlusion, or extreme head poses. Heatmap-based Regression
(HBR) and Coordinate-based Regression (CBR) are among the two mainly used
methods for face alignment. CBR methods require less computer memory, though
their performance is less than HBR methods. In this paper, we propose an
Adaptive Coordinate-based Regression (ACR) loss to improve the accuracy of CBR
for face alignment. Inspired by the Active Shape Model (ASM), we generate
Smooth-Face objects, a set of facial landmark points with less variations
compared to the ground truth landmark points. We then introduce a method to
estimate the level of difficulty in predicting each landmark point for the
network by comparing the distribution of the ground truth landmark points and
the corresponding Smooth-Face objects. Our proposed ACR Loss can adaptively
modify its curvature and the influence of the loss based on the difficulty
level of predicting each landmark point in a face. Accordingly, the ACR Loss
guides the network toward challenging points than easier points, which improves
the accuracy of the face alignment task. Our extensive evaluation shows the
capabilities of the proposed ACR Loss in predicting facial landmark points in
various facial images.
- Abstract(参考訳): ディープニューラルネットワークは、顔のアライメントを解決する上で妥当な精度を実現していますが、特に顔画像、オクルージョン、極端な頭部ポーズを扱う場合には、依然として難しい作業です。
熱マップ型回帰 (hbr) と座標型回帰 (cbr) は, 主に顔アライメントの手法である。
cbrメソッドは、hbrメソッドよりも性能が低いが、コンピュータメモリを少なくする。
本稿では,顔アライメントのためのcbrの精度を向上させるために,適応座標ベース回帰(acr)損失を提案する。
Active Shape Model (ASM) にインスパイアされ, 顔のランドマーク点の集合であるSmooth-Faceオブジェクトを生成する。
次に、地上真理ランドマークポイントと対応する平滑面オブジェクトの分布を比較することにより、ネットワークにおける各ランドマークポイントの予測の難易度を推定する手法を提案する。
提案したACR損失は,顔の各目印点の予測の難易度に基づいて,その曲率と損失の影響を適応的に修正することができる。
したがって、acr損失は、より簡単な点よりもチャレンジポイントに向かってネットワークを誘導し、顔アライメントタスクの精度を向上させる。
本研究は,様々な顔画像における顔のランドマークポイントの予測における acr 損失の可能性を広範囲に評価した。
関連論文リスト
- W-Net: A Facial Feature-Guided Face Super-Resolution Network [8.037821981254389]
Face Super-Resolutionは、高解像度 (HR) の顔画像を低解像度 (LR) の顔画像から復元することを目的としている。
既存手法は, 再建効率が低く, 事前情報の利用が不十分であるため, 理想的ではない。
本稿では,この課題に対処するため,W-Netと呼ばれる新しいネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-06-02T09:05:40Z) - Face Shape-Guided Deep Feature Alignment for Face Recognition Robust to
Face Misalignment [32.53066213465744]
顔認識(FR)はコンピュータビジョンとパターン認識社会において活発に研究されている。
近年、ディープラーニングの進歩により、FR技術はベンチマークデータセットの大部分で高いパフォーマンスを示している。
しかし、FRアルゴリズムが現実世界のシナリオに適用されると、その性能は未だに満足できないことが知られている。
論文 参考訳(メタデータ) (2022-09-15T11:23:51Z) - AdaFace: Quality Adaptive Margin for Face Recognition [56.99208144386127]
本稿では、損失関数、すなわち画像品質における適応性の別の側面を紹介する。
そこで本稿では,画像品質に基づいて異なる難易度を示す新たな損失関数を提案する。
提案手法は,4つのデータセット上でのSoTA(State-of-the-art)による顔認識性能を向上させる。
論文 参考訳(メタデータ) (2022-04-03T01:23:41Z) - Poseur: Direct Human Pose Regression with Transformers [119.79232258661995]
単一画像からの2次元人間のポーズ推定に対する直接回帰に基づくアプローチを提案する。
私たちのフレームワークはエンドツーエンドの差別化が可能で、キーポイント間の依存関係を自然に活用することを学びます。
我々のアプローチは、最も優れたヒートマップベースのポーズ推定手法と比較して好意的に機能する最初の回帰ベースのアプローチである。
論文 参考訳(メタデータ) (2022-01-19T04:31:57Z) - FasterPose: A Faster Simple Baseline for Human Pose Estimation [65.8413964785972]
本稿では,高速ポーズ推定のためのLR表現を用いた費用対効果ネットワークの設計パラダイムであるFasterPoseを提案する。
我々は,FasterPoseのトレーニング挙動について検討し,収束を加速する新しい回帰クロスエントロピー(RCE)損失関数を定式化する。
従来のポーズ推定ネットワークと比較すると,FLOPの58%が減少し,精度が1.3%向上した。
論文 参考訳(メタデータ) (2021-07-07T13:39:08Z) - Locally Aware Piecewise Transformation Fields for 3D Human Mesh
Registration [67.69257782645789]
本論文では,3次元変換ベクトルを学習し,提案空間内の任意のクエリ点をリザーブ空間内の対応する位置にマップする部分変換場を提案する。
パラメトリックモデルにネットワークのポーズを合わせることで、特に極端なポーズにおいて、より優れた登録品質が得られることを示す。
論文 参考訳(メタデータ) (2021-04-16T15:16:09Z) - Contour Loss for Instance Segmentation via k-step Distance
Transformation Image [5.02853371403908]
インスタンスセグメンテーションは、画像内のターゲットを特定し、各ターゲット領域をピクセルレベルでセグメンテーションすることを目指しています。
Mask R-CNNは、インスタンスセグメンテーションの古典的な方法ですが、その予測マスクは不明確で輪郭の近くで不正確です。
より正確なインスタンスセグメンテーションを保証できるcontour lossと呼ばれる新しい損失関数を提案する。
論文 参考訳(メタデータ) (2021-02-22T09:35:35Z) - Robust Face Alignment by Multi-order High-precision Hourglass Network [44.94500006611075]
本稿では,熱マップサブピクセル回帰 (HSR) 法と多階クロスジオメトリ・アウェア (MCG) モデルを提案する。
HSR法は、よく設計されたサブピクセル検出損失(SDL)とサブピクセル検出技術(SDT)により、高精度なランドマーク検出を実現するために提案されている。
同時に、MCGモデルは、提案した多階交差情報を用いて、顔の幾何学的制約と文脈情報を強化するためのより識別的な表現を学習することができる。
論文 参考訳(メタデータ) (2020-10-17T05:40:30Z) - LM-Reloc: Levenberg-Marquardt Based Direct Visual Relocalization [54.77498358487812]
LM-Relocは、直接画像アライメントに基づく視覚的再ローカライズのための新しいアプローチである。
本稿では,LM-Net を学習するための古典的レバンス・マルカルトアルゴリズムにインスパイアされた損失定式化を提案する。
論文 参考訳(メタデータ) (2020-10-13T12:15:20Z) - Bottom-Up Human Pose Estimation by Ranking Heatmap-Guided Adaptive
Keypoint Estimates [76.51095823248104]
キーポイント検出とグループ化(キーポイント回帰)性能を改善するために,これまでにほとんど,あるいはまったく研究されていないいくつかのスキームを提案する。
まず,画素単位のキーポイントレグレッションに対して,キーポイントのリグレッションを改善するために分離する代わりに,キーポイントのヒートマップを利用する。
第2に、スケールと向きの分散を扱うための適応表現を学習するために、画素単位の空間変換器ネットワークを採用する。
第3に,真のポーズとなる確率の高い推定ポーズを促進するために,結合形状と熱値評価手法を提案する。
論文 参考訳(メタデータ) (2020-06-28T01:14:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。