論文の概要: Robust Facial Landmark Detection by Cross-order Cross-semantic Deep
Network
- arxiv url: http://arxiv.org/abs/2011.07777v1
- Date: Mon, 16 Nov 2020 08:19:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-25 00:34:14.023557
- Title: Robust Facial Landmark Detection by Cross-order Cross-semantic Deep
Network
- Title(参考訳): クロスオーダークロスセマンティクスディープネットワークによるロバストな顔ランドマーク検出
- Authors: Jun Wan, Zhihui Lai, Linlin Shen, Jie Zhou, Can Gao, Gang Xiao and
Xianxu Hou
- Abstract要約: 顔のランドマーク検出を堅牢にするためのセマンティックな特徴学習を促進するために,クロスオーダー・クロスセマンティック・ディープ・ネットワーク(CCDN)を提案する。
具体的には、より識別的な表現学習のためのクロスオーダーチャネル相関を導入するために、クロスオーダー2列マルチ励起(CTM)モジュールを提案する。
新しいクロス・オーダー・クロス・セマンティック・レギュレータ (COCS) は、顔のランドマーク検出のために異なるアクティベーションからクロス・オーダーのクロス・セマンティック特徴を学習するためにネットワークを駆動するように設計されている。
- 参考スコア(独自算出の注目度): 58.843211405385205
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, convolutional neural networks (CNNs)-based facial landmark
detection methods have achieved great success. However, most of existing
CNN-based facial landmark detection methods have not attempted to activate
multiple correlated facial parts and learn different semantic features from
them that they can not accurately model the relationships among the local
details and can not fully explore more discriminative and fine semantic
features, thus they suffer from partial occlusions and large pose variations.
To address these problems, we propose a cross-order cross-semantic deep network
(CCDN) to boost the semantic features learning for robust facial landmark
detection. Specifically, a cross-order two-squeeze multi-excitation (CTM)
module is proposed to introduce the cross-order channel correlations for more
discriminative representations learning and multiple attention-specific part
activation. Moreover, a novel cross-order cross-semantic (COCS) regularizer is
designed to drive the network to learn cross-order cross-semantic features from
different activation for facial landmark detection. It is interesting to show
that by integrating the CTM module and COCS regularizer, the proposed CCDN can
effectively activate and learn more fine and complementary cross-order
cross-semantic features to improve the accuracy of facial landmark detection
under extremely challenging scenarios. Experimental results on challenging
benchmark datasets demonstrate the superiority of our CCDN over
state-of-the-art facial landmark detection methods.
- Abstract(参考訳): 近年,畳み込みニューラルネットワーク(cnns)ベースの顔ランドマーク検出手法が大きな成功を収めている。
しかし、既存のcnnベースの顔ランドマーク検出手法のほとんどは、複数の相関した顔部位を活性化して異なる意味的特徴を学習しようとはしていないため、局所的詳細の関係を正確にモデル化できず、より識別的で微妙な意味的特徴を十分に探求できないため、部分的な閉塞と大きなポーズ変化に苦しむ。
これらの問題に対処するため,顔のランドマーク検出のためのセマンティック特徴学習を促進するために,クロスオーダー・クロスセマンティック・ディープ・ネットワーク(CCDN)を提案する。
具体的には、より識別的な表現学習と複数注意特化部分アクティベーションのためのクロスオーダーチャネル相関を導入するために、CTMモジュールを提案する。
さらに, 顔のランドマーク検出のための異なるアクティベーションから, クロスセマンティック特徴を学習するために, ネットワークを駆動する新しいクロスセマンティック正規化器が設計された。
CTMモジュールとCOCS正規化器を統合することで、CCDNはより微細で相補的なクロスセマンティックな特徴を効果的に活性化し、学習し、極めて困難なシナリオ下で顔のランドマーク検出の精度を向上させることができることを示すことは興味深い。
挑戦的なベンチマークデータセットの実験結果は、最先端の顔ランドマーク検出法よりもCCDNの方が優れていることを示している。
関連論文リスト
- UniForensics: Face Forgery Detection via General Facial Representation [60.5421627990707]
高レベルの意味的特徴は摂動の影響を受けにくく、フォージェリー固有の人工物に限らないため、より強い一般化がある。
我々は、トランスフォーマーベースのビデオネットワークを活用する新しいディープフェイク検出フレームワークUniForensicsを導入し、顔の豊かな表現のためのメタファンクショナルな顔分類を行う。
論文 参考訳(メタデータ) (2024-07-26T20:51:54Z) - Improving Vision Anomaly Detection with the Guidance of Language
Modality [64.53005837237754]
本稿では,マルチモーダルの観点から視覚モダリティの課題に取り組む。
本稿では,冗長な情報問題とスパース空間問題に対処するために,クロスモーダルガイダンス(CMG)を提案する。
視覚異常検出のためのよりコンパクトな潜在空間を学習するために、CMLEは言語モダリティから相関構造行列を学習する。
論文 参考訳(メタデータ) (2023-10-04T13:44:56Z) - COMICS: End-to-end Bi-grained Contrastive Learning for Multi-face Forgery Detection [56.7599217711363]
顔偽造認識法は一度に1つの顔しか処理できない。
ほとんどの顔偽造認識法は一度に1つの顔しか処理できない。
マルチフェイスフォージェリ検出のためのエンドツーエンドフレームワークであるCOMICSを提案する。
論文 参考訳(メタデータ) (2023-08-03T03:37:13Z) - MC-LCR: Multi-modal contrastive classification by locally correlated
representations for effective face forgery detection [11.124150983521158]
局所的関連表現を用いたマルチモーダルコントラスト分類法を提案する。
我々のMC-LCRは、空間領域と周波数領域の両方から真偽顔と偽顔の暗黙の局所的不一致を増幅することを目的としている。
我々は最先端の性能を達成し,本手法の堅牢性と一般化を実証する。
論文 参考訳(メタデータ) (2021-10-07T09:24:12Z) - MD-CSDNetwork: Multi-Domain Cross Stitched Network for Deepfake
Detection [80.83725644958633]
現在のディープフェイク生成法では、偽画像やビデオの周波数スペクトルに識別的アーティファクトが残されている。
MD-CSDNetwork(MD-CSDNetwork)と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-09-15T14:11:53Z) - Distract Your Attention: Multi-head Cross Attention Network for Facial
Expression Recognition [4.500212131331687]
本稿では,DAN(Distract your Attention Network)と呼ばれる新しい表情認識ネットワークを提案する。
本手法は2つの重要な観察結果に基づいており、複数のクラスが本質的に類似した顔の外観を共有しており、その違いは微妙である可能性がある。
特徴クラスタリングネットワーク(FCN)、マルチヘッドクロスアテンションネットワーク(MAN)、アテンションフュージョンネットワーク(AFN)の3つの主要コンポーネントでDANを提案する。
論文 参考訳(メタデータ) (2021-09-15T13:15:54Z) - Hierarchical Deep CNN Feature Set-Based Representation Learning for
Robust Cross-Resolution Face Recognition [59.29808528182607]
クロスリゾリューション顔認識(CRFR)は、インテリジェントな監視およびバイオメトリックフォレンジックにおいて重要である。
既存の浅層学習と深層学習に基づく手法は、HR-LR対を共同特徴空間にマッピングすることに焦点を当てている。
本研究では,多レベル深層畳み込みニューラルネットワーク(CNN)の機能を完全に活用し,堅牢なCRFRを実現することを目的とする。
論文 参考訳(メタデータ) (2021-03-25T14:03:42Z) - Robust Facial Landmark Detection by Multi-order Multi-constraint Deep
Networks [35.19368350816032]
より強力な特徴相関と制約学習のためのマルチオーダーマルチ制約ディープネットワーク(MMDN)を提案する。
Inlicit Multi-order Correlated Geometry-Aware (IMCG) モデルを提案し,多次空間相関と多次チャネル相関を導入する。
説明確率に基づく境界適応回帰(EPBR)法は、グローバルな形状制約を強化するために開発されている。
論文 参考訳(メタデータ) (2020-12-09T09:11:47Z) - Cross-Correlated Attention Networks for Person Re-Identification [34.84287025161801]
我々はCCA(Cross-Correlated Attention)と呼ばれる新しいアテンションモジュールを提案する。
CCAは、参加する異なる地域間での情報ゲインを最大化することで、そのような制限を克服することを目指している。
また,人物画像の頑健かつ識別的な表現を学習するために,異なる注意機構を利用する新しいディープネットワークを提案する。
論文 参考訳(メタデータ) (2020-06-17T01:47:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。