論文の概要: Robust and Precise Facial Landmark Detection by Self-Calibrated Pose
Attention Network
- arxiv url: http://arxiv.org/abs/2112.12328v1
- Date: Thu, 23 Dec 2021 02:51:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-24 16:44:00.696183
- Title: Robust and Precise Facial Landmark Detection by Self-Calibrated Pose
Attention Network
- Title(参考訳): 自己調整型ポーズアテンションネットワークによるロバストで精密な顔ランドマーク検出
- Authors: Jun Wan, Hui Xi, Jie Zhou, Zhihui Lai, Witold Pedrycz, Xu Wang and
Hang Sun
- Abstract要約: より堅牢で正確な顔のランドマーク検出を実現するための半教師付きフレームワークを提案する。
より効果的な顔形状制約をモデル化するために,境界対応ランドマーク強度(BALI)フィールドを提案する。
自己キャリブレーション・ポース・アテンション(SCPA)モデルは、中間的監督を強制する自己学習型目標関数を提供するように設計されている。
- 参考スコア(独自算出の注目度): 73.56802915291917
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current fully-supervised facial landmark detection methods have progressed
rapidly and achieved remarkable performance. However, they still suffer when
coping with faces under large poses and heavy occlusions for inaccurate facial
shape constraints and insufficient labeled training samples. In this paper, we
propose a semi-supervised framework, i.e., a Self-Calibrated Pose Attention
Network (SCPAN) to achieve more robust and precise facial landmark detection in
challenging scenarios. To be specific, a Boundary-Aware Landmark Intensity
(BALI) field is proposed to model more effective facial shape constraints by
fusing boundary and landmark intensity field information. Moreover, a
Self-Calibrated Pose Attention (SCPA) model is designed to provide a
self-learned objective function that enforces intermediate supervision without
label information by introducing a self-calibrated mechanism and a pose
attention mask. We show that by integrating the BALI fields and SCPA model into
a novel self-calibrated pose attention network, more facial prior knowledge can
be learned and the detection accuracy and robustness of our method for faces
with large poses and heavy occlusions have been improved. The experimental
results obtained for challenging benchmark datasets demonstrate that our
approach outperforms state-of-the-art methods in the literature.
- Abstract(参考訳): 現在の完全に監視された顔ランドマーク検出法は急速に進歩し、目覚ましい性能を達成している。
しかし、大きなポーズで顔に対処したり、不正確な顔形状の制約やラベル付きトレーニングサンプルが不十分な場合、依然として苦しめられている。
本稿では,より堅牢で正確な顔のランドマーク検出を実現するための半教師付きフレームワーク,すなわち自己校正型姿勢注意ネットワーク(SCPAN)を提案する。
具体的には、境界線とランドマーク強度場情報を融合させることにより、より効果的な顔形状制約をモデル化する境界線対応ランドマーク強度(BALI)フィールドを提案する。
さらに、自己校正機構とポーズアテンションマスクを導入することにより、ラベル情報なしで中間管理を強制する自己学習型目標関数を提供するために、自己校正ポスアテンション(SCPA)モデルが設計された。
本研究では,BALIフィールドとSCPAモデルを新たな自己校正型ポーズアテンションネットワークに統合することにより,顔の事前知識を学習し,大きなポーズを持つ顔に対する検出精度とロバスト性を改善したことを示す。
ベンチマークデータセットに挑戦して得られた実験結果から,本手法が文献の最先端手法より優れていることが示された。
関連論文リスト
- Certifying Robustness of Learning-Based Keypoint Detection and Pose Estimation Methods [9.953693315812995]
この研究は、視覚に基づく2段階の6次元オブジェクトポーズ推定の堅牢性の証明に対処する。
中心となる考え方は、ローカルロバストネスの認定を、分類タスクのニューラルネットワーク検証に変換することである。
論文 参考訳(メタデータ) (2024-07-31T19:02:54Z) - UniForensics: Face Forgery Detection via General Facial Representation [60.5421627990707]
高レベルの意味的特徴は摂動の影響を受けにくく、フォージェリー固有の人工物に限らないため、より強い一般化がある。
我々は、トランスフォーマーベースのビデオネットワークを活用する新しいディープフェイク検出フレームワークUniForensicsを導入し、顔の豊かな表現のためのメタファンクショナルな顔分類を行う。
論文 参考訳(メタデータ) (2024-07-26T20:51:54Z) - Toward Motion Robustness: A masked attention regularization framework in remote photoplethysmography [5.743550396843244]
MAR-rはROIローカライゼーションと複雑なモーションアーティファクトの影響を統合するフレームワークである。
MAR-rは、顔クリップのセマンティック一貫性を捉えるために、マスクされた注意規則化機構をrフィールドに採用している。
また、モデルが不正確なROIに過度に適合し、その後パフォーマンスが低下するのを防ぐために、マスキング技術を採用している。
論文 参考訳(メタデータ) (2024-07-09T08:25:30Z) - Improving Facial Landmark Detection Accuracy and Efficiency with Knowledge Distillation [4.779050216649159]
本稿では,知識蒸留法の開発を通じて,これらの課題に対処する新しいアプローチを提案する。
私たちの目標は、さまざまな条件下で顔のランドマークを正確に特定できるモデルを設計することです。
この手法は成功し、IEEE ICME 2024 PAIRコンペティションの参加者165人中6位に終わった。
論文 参考訳(メタデータ) (2024-04-09T05:30:58Z) - Extreme Miscalibration and the Illusion of Adversarial Robustness [66.29268991629085]
敵の訓練は、しばしばモデルの堅牢性を高めるために使用される。
我々は、この観測されたロバストネスの利得はロバストネスの錯覚(IOR)であることを示した。
我々は,NLPコミュニティに対して,試験時間温度のスケーリングを堅牢性評価に組み込むよう促す。
論文 参考訳(メタデータ) (2024-02-27T13:49:12Z) - Certified Interpretability Robustness for Class Activation Mapping [77.58769591550225]
本稿では,解釈可能性マップのためのCORGI(Certifiable prOvable Robustness Guarantees)を提案する。
CORGIは入力画像を取り込み、そのCAM解釈可能性マップのロバスト性に対する証明可能な下限を与えるアルゴリズムである。
交通標識データを用いたケーススタディによるCORGIの有効性を示す。
論文 参考訳(メタデータ) (2023-01-26T18:58:11Z) - Occlusion-Robust FAU Recognition by Mining Latent Space of Masked
Autoencoders [23.39566752915331]
顔面行動単位(FAUs)は、きめ細かい表情解析に重要である。
新しいアプローチは、マスク付きオートエンコーダ(MAE)の潜伏空間からの豊富な情報を活用し、FAU機能に変換する。
FAUは、通常の条件下での最先端の手法と同等の性能を達成できる。
論文 参考訳(メタデータ) (2022-12-08T01:57:48Z) - Adversarially-Aware Robust Object Detector [85.10894272034135]
本稿では,ロバスト検出器 (RobustDet) を提案する。
本モデルは, クリーン画像の検出能力を維持しながら, 傾きを効果的に解き, 検出堅牢性を著しく向上させる。
論文 参考訳(メタデータ) (2022-07-13T13:59:59Z) - Suppressing Uncertainties for Large-Scale Facial Expression Recognition [81.51495681011404]
本稿では,不確実性を効果的に抑制し,深層ネットワークが不確実な顔画像に過度に収まらないような,シンプルで効率的なセルフキュアネットワーク(SCN)を提案する。
公開ベンチマークの結果、我々のSCNは現在の最先端メソッドよりも、RAF-DBで textbf88.14%、AffectNetで textbf60.23%、FERPlusで textbf89.35% を上回りました。
論文 参考訳(メタデータ) (2020-02-24T17:24:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。