論文の概要: Robust Facial Landmark Detection by Multi-order Multi-constraint Deep
Networks
- arxiv url: http://arxiv.org/abs/2012.04927v2
- Date: Thu, 10 Dec 2020 23:39:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-16 02:04:00.838622
- Title: Robust Facial Landmark Detection by Multi-order Multi-constraint Deep
Networks
- Title(参考訳): 多次元多層ディープネットワークによるロバストな顔ランドマーク検出
- Authors: Jun Wan, Zhihui Lai, Jing Li, Jie Zhou, Can Gao
- Abstract要約: より強力な特徴相関と制約学習のためのマルチオーダーマルチ制約ディープネットワーク(MMDN)を提案する。
Inlicit Multi-order Correlated Geometry-Aware (IMCG) モデルを提案し,多次空間相関と多次チャネル相関を導入する。
説明確率に基づく境界適応回帰(EPBR)法は、グローバルな形状制約を強化するために開発されている。
- 参考スコア(独自算出の注目度): 35.19368350816032
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, heatmap regression has been widely explored in facial landmark
detection and obtained remarkable performance. However, most of the existing
heatmap regression-based facial landmark detection methods neglect to explore
the high-order feature correlations, which is very important to learn more
representative features and enhance shape constraints. Moreover, no explicit
global shape constraints have been added to the final predicted landmarks,
which leads to a reduction in accuracy. To address these issues, in this paper,
we propose a Multi-order Multi-constraint Deep Network (MMDN) for more powerful
feature correlations and shape constraints learning. Specifically, an Implicit
Multi-order Correlating Geometry-aware (IMCG) model is proposed to introduce
the multi-order spatial correlations and multi-order channel correlations for
more discriminative representations. Furthermore, an Explicit Probability-based
Boundary-adaptive Regression (EPBR) method is developed to enhance the global
shape constraints and further search the semantically consistent landmarks in
the predicted boundary for robust facial landmark detection. It's interesting
to show that the proposed MMDN can generate more accurate boundary-adaptive
landmark heatmaps and effectively enhance shape constraints to the predicted
landmarks for faces with large pose variations and heavy occlusions.
Experimental results on challenging benchmark datasets demonstrate the
superiority of our MMDN over state-of-the-art facial landmark detection
methods. The code has been publicly available at
https://github.com/junwan2014/MMDN-master.
- Abstract(参考訳): 近年,顔のランドマーク検出において熱マップの回帰が広く研究され,優れた性能が得られた。
しかしながら、既存のヒートマップ回帰に基づく顔ランドマーク検出手法のほとんどは、高次特徴相関の探索を怠り、より代表的特徴を学び、形状制約を強化するために非常に重要である。
さらに、最終的な予測されたランドマークに明示的なグローバル形状の制約が加えられていないため、精度が低下する。
本稿では,より強力な特徴相関と形状制約学習のためのマルチオーダーマルチ制約ディープネットワーク(MMDN)を提案する。
具体的には、より識別的な表現のための多階空間相関と多階チャネル相関を導入するために、IMCGモデルを提案する。
さらに, 明示的確率に基づく境界適応回帰法 (EPBR) を開発し, 大域的な形状制約を強化し, 予測境界における意味的に整合性のあるランドマークを探索し, 頑健な顔のランドマーク検出を行う。
提案したMDDNは、より正確な境界適応型ランドマークマップを生成し、大きなポーズのバリエーションと重いオクルージョンを持つ顔の予測されたランドマークに対する形状制約を効果的に強化できることは興味深い。
挑戦的なベンチマークデータセットの実験結果は、最先端の顔ランドマーク検出法よりもMDNの方が優れていることを示している。
コードはhttps://github.com/junwan 2014/MMDN-masterで公開されている。
関連論文リスト
- Fine-grained Dynamic Network for Generic Event Boundary Detection [9.17191007695011]
そこで我々は,DyBDetという汎用イベント境界のための新しい動的パイプラインを提案する。
マルチエグジットネットワークアーキテクチャを導入することで、DyBDetは、異なるビデオスニペットへのアロケーションを自動的に学習する。
Kinetics-GEBD と TAPOS のデータセットに挑戦する実験では、動的戦略の採用が GEBD タスクに大きく貢献することを示した。
論文 参考訳(メタデータ) (2024-07-05T06:02:46Z) - Temporal Action Localization with Enhanced Instant Discriminability [66.76095239972094]
時間的行動検出(TAD)は、すべての行動境界とその対応するカテゴリを、トリミングされていないビデオで検出することを目的としている。
本稿では,既存の手法による動作境界の不正確な予測を解決するために,TriDetという一段階のフレームワークを提案する。
実験結果から,複数のTADデータセット上でのTriDetの堅牢性と最先端性能が示された。
論文 参考訳(メタデータ) (2023-09-11T16:17:50Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - COMICS: End-to-end Bi-grained Contrastive Learning for Multi-face Forgery Detection [56.7599217711363]
顔偽造認識法は一度に1つの顔しか処理できない。
ほとんどの顔偽造認識法は一度に1つの顔しか処理できない。
マルチフェイスフォージェリ検出のためのエンドツーエンドフレームワークであるCOMICSを提案する。
論文 参考訳(メタデータ) (2023-08-03T03:37:13Z) - HiDAnet: RGB-D Salient Object Detection via Hierarchical Depth Awareness [2.341385717236931]
本稿では,RGB-Dサリエンシ検出のための階層的深度認識ネットワーク(HiDAnet)を提案する。
我々のモチベーションは、幾何学的先行の多粒性特性がニューラルネットワーク階層とよく相関しているという観察から来ています。
当社のHiDAnetは最先端の手法よりも大きなマージンで良好に動作します。
論文 参考訳(メタデータ) (2023-01-18T10:00:59Z) - MRDet: A Multi-Head Network for Accurate Oriented Object Detection in
Aerial Images [51.227489316673484]
水平アンカーから変換された指向性提案を生成するために、任意指向領域提案ネットワーク(AO-RPN)を提案する。
正確なバウンディングボックスを得るために,検出タスクを複数のサブタスクに分離し,マルチヘッドネットワークを提案する。
各ヘッドは、対応するタスクに最適な特徴を学習するために特別に設計されており、ネットワークがオブジェクトを正確に検出することができる。
論文 参考訳(メタデータ) (2020-12-24T06:36:48Z) - Robust Facial Landmark Detection by Cross-order Cross-semantic Deep
Network [58.843211405385205]
顔のランドマーク検出を堅牢にするためのセマンティックな特徴学習を促進するために,クロスオーダー・クロスセマンティック・ディープ・ネットワーク(CCDN)を提案する。
具体的には、より識別的な表現学習のためのクロスオーダーチャネル相関を導入するために、クロスオーダー2列マルチ励起(CTM)モジュールを提案する。
新しいクロス・オーダー・クロス・セマンティック・レギュレータ (COCS) は、顔のランドマーク検出のために異なるアクティベーションからクロス・オーダーのクロス・セマンティック特徴を学習するためにネットワークを駆動するように設計されている。
論文 参考訳(メタデータ) (2020-11-16T08:19:26Z) - Robust Face Alignment by Multi-order High-precision Hourglass Network [44.94500006611075]
本稿では,熱マップサブピクセル回帰 (HSR) 法と多階クロスジオメトリ・アウェア (MCG) モデルを提案する。
HSR法は、よく設計されたサブピクセル検出損失(SDL)とサブピクセル検出技術(SDT)により、高精度なランドマーク検出を実現するために提案されている。
同時に、MCGモデルは、提案した多階交差情報を用いて、顔の幾何学的制約と文脈情報を強化するためのより識別的な表現を学習することができる。
論文 参考訳(メタデータ) (2020-10-17T05:40:30Z) - Think about boundary: Fusing multi-level boundary information for
landmark heatmap regression [51.48533538153833]
顔の境界とランドマークの関係を探索するための2段階のエンドツーエンドアプローチについて検討する。
境界対応ランドマーク予測は,自己校正境界推定(SCBE)モジュールと境界対応ランドマーク変換(BALT)モジュールの2つのモジュールで構成される。
我々の手法は文学における最先端の手法より優れている。
論文 参考訳(メタデータ) (2020-08-25T10:14:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。