論文の概要: OccFace: Unified Occlusion-Aware Facial Landmark Detection with Per-Point Visibility
- arxiv url: http://arxiv.org/abs/2602.10728v1
- Date: Wed, 11 Feb 2026 10:42:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-12 21:44:01.771385
- Title: OccFace: Unified Occlusion-Aware Facial Landmark Detection with Per-Point Visibility
- Title(参考訳): OccFace: 点ごとの可視性を考慮した一元的咬合認識顔画像検出
- Authors: Xinhao Xiang, Zhengxin Li, Saurav Dhakad, Theo Bancroft, Jiawei Zhang, Weiyang Li,
- Abstract要約: OccFaceは、普遍的な人間のような顔のためのオクルージョン認識フレームワークである。
OccFaceは100ポイントの統一レイアウトとヒートマップベースのバックボーンを採用している。
OccFaceは、ローカルエビデンスとランドマークコンテキストを組み合わせることで、ランドマーク座標とポイント単位の可視性を予測する。
- 参考スコア(独自算出の注目度): 8.708549462490295
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate facial landmark detection under occlusion remains challenging, especially for human-like faces with large appearance variation and rotation-driven self-occlusion. Existing detectors typically localize landmarks while handling occlusion implicitly, without predicting per-point visibility that downstream applications can benefits. We present OccFace, an occlusion-aware framework for universal human-like faces, including humans, stylized characters, and other non-human designs. OccFace adopts a unified dense 100-point layout and a heatmap-based backbone, and adds an occlusion module that jointly predicts landmark coordinates and per-point visibility by combining local evidence with cross-landmark context. Visibility supervision mixes manual labels with landmark-aware masking that derives pseudo visibility from mask-heatmap overlap. We also create an occlusion-aware evaluation suite reporting NME on visible vs. occluded landmarks and benchmarking visibility with Occ AP, F1@0.5, and ROC-AUC, together with a dataset annotated with 100-point landmarks and per-point visibility. Experiments show improved robustness under external occlusion and large head rotations, especially on occluded regions, while preserving accuracy on visible landmarks.
- Abstract(参考訳): 隠蔽下での正確な顔のランドマーク検出は、特に大きな外観変化と回転駆動の自己閉塞を持つヒトのような顔では、依然として困難である。
既存の検出器は典型的にランドマークをローカライズするが、ダウンストリームアプリケーションが利点を享受できる点ごとの可視性を予測せずに、隠蔽を暗黙的に扱う。
OccFaceは、人間、スタイリングされたキャラクター、その他の人間以外のデザインを含む、普遍的な人間のような顔のためのオクルージョン対応のフレームワークである。
OccFaceは、密集した100点レイアウトとヒートマップベースのバックボーンを採用し、ランドマークコンテキストとローカルエビデンスを組み合わせることで、ランドマーク座標とポイント単位の可視性を共同で予測するオクルージョンモジュールを追加した。
可視性監視は、手動ラベルとランドマークを意識したマスキングを混合し、マスクとヒートマップのオーバーラップから擬似的な可視性を引き出す。
また,Occ AP, F1@0.5, ROC-AUCを用いて,100点のランドマークとポイント単位の可視性を備えたデータセットとともに,可視性対隠蔽ランドマークに関するNMEを報告したオクルージョン認識評価スイートを作成している。
実験では、特に閉塞領域において、外咬合下での頑丈さと大きな頭部回転により、目に見えるランドマークの精度を保ちながら、頑健さが向上した。
関連論文リスト
- ORFormer: Occlusion-Robust Transformer for Accurate Facial Landmark Detection [18.253063326787647]
ORFormerは、見えない領域を検出し、見えない部分から欠落した機能を回復することができる。
本手法は,下流FLDタスクに対して高品質なヒートマップをコンパイルする。
得られた熱マップを既存のFLD手法に組み込むことで,挑戦的なデータセット上での芸術的状況に対して好意的に機能する。
論文 参考訳(メタデータ) (2024-12-17T18:53:43Z) - Latent-OFER: Detect, Mask, and Reconstruct with Latent Vectors for
Occluded Facial Expression Recognition [0.0]
提案手法は, 顔の隠蔽部分を, 隠蔽されていないかのように検出し, 認識し, FER精度を向上する。
まず、視覚変換器(ViT)ベースのオクルージョンパッチ検出器は、隠蔽されたパッチから潜在ベクトルのみを訓練することで、隠蔽された位置をマスクする。
第2に、ハイブリッド再構成ネットワークは、ViTと畳み込みニューラルネットワーク(CNN)を用いて、完全な画像としてマスキング位置を生成する。
最後に、式関連潜時ベクトル抽出器は、CNNに基づくクラスアクティベーションマップを適用して、すべての潜時ベクトルから式関連情報を検索し、使用する。
論文 参考訳(メタデータ) (2023-07-21T07:56:32Z) - Unsupervised 3D Keypoint Discovery with Multi-View Geometry [104.76006413355485]
本研究では,多視点画像から人体上の3Dキーポイントを,監督やラベルなしで発見するアルゴリズムを提案する。
我々の手法は、他の最先端の教師なしアプローチと比較して、より解釈可能で正確な3Dキーポイントを発見する。
論文 参考訳(メタデータ) (2022-11-23T10:25:12Z) - End2End Occluded Face Recognition by Masking Corrupted Features [82.27588990277192]
最先端の一般的な顔認識モデルは、隠蔽された顔画像に対してうまく一般化しない。
本稿では,1つのエンドツーエンドのディープニューラルネットワークに基づいて,オクルージョンに頑健な新しい顔認識手法を提案する。
我々のアプローチは、深い畳み込みニューラルネットワークから破損した特徴を発見し、動的に学習されたマスクによってそれらをきれいにする。
論文 参考訳(メタデータ) (2021-08-21T09:08:41Z) - Locality-aware Channel-wise Dropout for Occluded Face Recognition [116.2355331029041]
顔認識は、特に顔が部分的に隠されている場合、制約のないシナリオでは難しいタスクである。
そこで本研究では,ニューロン群の活性化を,精巧に選択されたチャネルに落とすことによって,新しい,エレガントなオクルージョン・シミュレート法を提案する。
種々のベンチマーク実験により,提案手法は最先端の手法よりも優れた性能を示し,性能が向上した。
論文 参考訳(メタデータ) (2021-07-20T05:53:14Z) - When Face Recognition Meets Occlusion: A New Benchmark [37.616211206620854]
擬似閉塞顔認識データセットを作成します。
対象は10,575人の顔画像804,704枚。
私たちのデータセットは最先端のものを大幅に上回ります。
論文 参考訳(メタデータ) (2021-03-04T03:07:42Z) - Robust Facial Landmark Detection by Cross-order Cross-semantic Deep
Network [58.843211405385205]
顔のランドマーク検出を堅牢にするためのセマンティックな特徴学習を促進するために,クロスオーダー・クロスセマンティック・ディープ・ネットワーク(CCDN)を提案する。
具体的には、より識別的な表現学習のためのクロスオーダーチャネル相関を導入するために、クロスオーダー2列マルチ励起(CTM)モジュールを提案する。
新しいクロス・オーダー・クロス・セマンティック・レギュレータ (COCS) は、顔のランドマーク検出のために異なるアクティベーションからクロス・オーダーのクロス・セマンティック特徴を学習するためにネットワークを駆動するように設計されている。
論文 参考訳(メタデータ) (2020-11-16T08:19:26Z) - Deep Structured Prediction for Facial Landmark Detection [59.60946775628646]
本稿では,深層畳み込みネットワークと条件付きランダムフィールドを組み合わせた深層構造顔のランドマーク検出手法を提案する。
顔のランドマーク検出における最先端技術よりも優れた性能を示す。
論文 参考訳(メタデータ) (2020-10-18T17:09:24Z) - Occlusion-Adaptive Deep Network for Robust Facial Expression Recognition [56.11054589916299]
本研究では,隠蔽領域から腐敗した特徴を発見・破棄するためのランドマーク誘導型アテンションブランチを提案する。
注意マップが最初に作成され、特定の顔部が閉鎖されているかどうかを示し、我々のモデルを非閉鎖領域に誘導する。
これにより、顔が部分的に隠されている場合でも、表情認識システムが回復することができる。
論文 参考訳(メタデータ) (2020-05-12T20:42:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。