論文の概要: Sparse Local Patch Transformer for Robust Face Alignment and Landmarks
Inherent Relation Learning
- arxiv url: http://arxiv.org/abs/2203.06541v1
- Date: Sun, 13 Mar 2022 01:15:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-15 16:09:28.705389
- Title: Sparse Local Patch Transformer for Robust Face Alignment and Landmarks
Inherent Relation Learning
- Title(参考訳): ロバスト顔アライメントのためのスパース局所パッチ変換器とランドマークの固有関係学習
- Authors: Jiahao Xia and Weiwei qu and Wenjian Huang and Jianguo Zhang and Xi
Wang and Min Xu
- Abstract要約: 固有関係を学習するためのスパース局所パッチ変換器(S)を提案する。
提案手法は計算量が少なくて最先端のレベルで機能する。
- 参考スコア(独自算出の注目度): 11.150290581561725
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Heatmap regression methods have dominated face alignment area in recent years
while they ignore the inherent relation between different landmarks. In this
paper, we propose a Sparse Local Patch Transformer (SLPT) for learning the
inherent relation. The SLPT generates the representation of each single
landmark from a local patch and aggregates them by an adaptive inherent
relation based on the attention mechanism. The subpixel coordinate of each
landmark is predicted independently based on the aggregated feature. Moreover,
a coarse-to-fine framework is further introduced to incorporate with the SLPT,
which enables the initial landmarks to gradually converge to the target facial
landmarks using fine-grained features from dynamically resized local patches.
Extensive experiments carried out on three popular benchmarks, including WFLW,
300W and COFW, demonstrate that the proposed method works at the
state-of-the-art level with much less computational complexity by learning the
inherent relation between facial landmarks. The code is available at the
project website.
- Abstract(参考訳): ヒートマップ回帰法は近年、異なるランドマーク間の固有の関係を無視しながら、顔のアライメント領域を支配している。
本稿では,固有関係を学習するためのスパース局所パッチトランスフォーマ(slpt)を提案する。
SLPTは、局所パッチから個々のランドマークの表現を生成し、アテンション機構に基づいて適応固有の関係でそれらを集約する。
各ランドマークのサブピクセル座標は、集約された特徴に基づいて独立に予測される。
さらに、SLPTを組み込むために粗粒度フレームワークがさらに導入され、これにより初期ランドマークが動的に再サイズされた局所パッチの微細な特徴を用いて、ターゲットの顔ランドマークに徐々に収束する。
WFLW、300W、COFWを含む3つの一般的なベンチマークで実施された大規模な実験により、提案手法は、顔のランドマーク間の固有の関係を学習することで、より少ない計算量で、最先端のレベルで機能することを示した。
コードはプロジェクトのwebサイトから入手できる。
関連論文リスト
- Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - Coupled Laplacian Eigenmaps for Locally-Aware 3D Rigid Point Cloud Matching [0.0]
局所構造を考慮したグラフラプラシアン固有写像に基づく新しい手法を提案する。
ラプラシアン固有写像の順序と符号のあいまいさに対処するために、結合ラプラシアンと呼ばれる新しい作用素を導入する。
これらの高次元空間間の類似性は、形状に一致するような局所的な意味のあるスコアを与えることを示す。
論文 参考訳(メタデータ) (2024-02-27T10:10:12Z) - LCPFormer: Towards Effective 3D Point Cloud Analysis via Local Context
Propagation in Transformers [60.51925353387151]
本稿では,近隣地域間のメッセージパッシングを活用するために,LCP (Local Context Propagation) という新しいモジュールを提案する。
隣接するローカル領域の重複点を仲介として使用した後、異なるローカルリージョンからの共有ポイントの特徴を再重み付けし、その後、次のレイヤに渡す。
提案手法は, 異なるタスクに適用可能であり, 3次元形状分類や高密度予測タスクを含むベンチマークにおいて, 様々なトランスフォーマーベースの手法より優れる。
論文 参考訳(メタデータ) (2022-10-23T15:43:01Z) - RePFormer: Refinement Pyramid Transformer for Robust Facial Landmark
Detection [131.1478251760399]
顔のランドマーク検出タスクをピラミッド記憶に沿ったランドマーククエリの精製として定式化する。
具体的には、ピラミッドトランスフォーマーヘッド(PTH)を導入し、ランドマーク間の関係とランドマークとクロススケールコンテキストの間の異種関係の両方を構築する。
動的ランドマークリファインメント(DLR)モジュールは、ランドマークレグレッションをエンドツーエンドのリファインメント手順に分解するために設計されている。
論文 参考訳(メタデータ) (2022-07-08T14:12:26Z) - A Transfer Learning approach to Heatmap Regression for Action Unit
intensity estimation [50.261472059743845]
アクション・ユニット(英: Action Units、AUs)は、幾何学に基づく原子性顔面筋運動である。
本稿では,その位置と強度を共同で推定する新しいAUモデリング問題を提案する。
ヒートマップは、所定の空間的位置でAUが発生するか否かをモデル化する。
論文 参考訳(メタデータ) (2020-04-14T16:51:13Z) - Multi-View Optimization of Local Feature Geometry [70.18863787469805]
本研究では,複数視点からの局所像の特徴の幾何を,未知のシーンやカメラの幾何を伴わずに精査する問題に対処する。
提案手法は,従来の特徴抽出とマッチングのパラダイムを自然に補完する。
本手法は,手作りと学習の両方の局所的特徴に対して,三角測量とカメラのローカライゼーション性能を常に向上することを示す。
論文 参考訳(メタデータ) (2020-03-18T17:22:11Z) - A Rotation-Invariant Framework for Deep Point Cloud Analysis [132.91915346157018]
ネットワーク入力時に一般的な3次元カルト座標を置き換えるために,新しい低レベル純粋回転不変表現を導入する。
また,これらの表現を特徴に組み込むネットワークアーキテクチャを提案し,点とその近傍の局所的関係とグローバルな形状構造を符号化する。
本手法は, 形状分類, 部分分割, 形状検索を含む多点雲解析タスクにおいて評価する。
論文 参考訳(メタデータ) (2020-03-16T14:04:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。