論文の概要: ADNet: Leveraging Error-Bias Towards Normal Direction in Face Alignment
- arxiv url: http://arxiv.org/abs/2109.05721v1
- Date: Mon, 13 Sep 2021 06:05:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-14 15:36:29.767942
- Title: ADNet: Leveraging Error-Bias Towards Normal Direction in Face Alignment
- Title(参考訳): ADNet: 顔アライメントにおける正常方向に向けたエラーバイアスの活用
- Authors: Yangyu Huang, Hao Yang, Chong Li, Jongyoo Kim, Fangyun Wei
- Abstract要約: 顔のアライメントにおける誤差バイアスの問題について検討し、ランドマーク誤差の分布が接線に沿ってランドマーク曲線に広がる傾向にあることを示した。
この観測から着想を得た我々は,CNNモデルのより良い収束のためにエラーバイアス特性を活用する方法を模索する。
配向および熱マップ回帰のための異方性方向損失(ADL)と異方性注意モジュール(AAM)を提案する。
- 参考スコア(独自算出の注目度): 28.301603455377435
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The recent progress of CNN has dramatically improved face alignment
performance. However, few works have paid attention to the error-bias with
respect to error distribution of facial landmarks. In this paper, we
investigate the error-bias issue in face alignment, where the distributions of
landmark errors tend to spread along the tangent line to landmark curves. This
error-bias is not trivial since it is closely connected to the ambiguous
landmark labeling task. Inspired by this observation, we seek a way to leverage
the error-bias property for better convergence of CNN model. To this end, we
propose anisotropic direction loss (ADL) and anisotropic attention module (AAM)
for coordinate and heatmap regression, respectively. ADL imposes strong binding
force in normal direction for each landmark point on facial boundaries. On the
other hand, AAM is an attention module which can get anisotropic attention mask
focusing on the region of point and its local edge connected by adjacent
points, it has a stronger response in tangent than in normal, which means
relaxed constraints in the tangent. These two methods work in a complementary
manner to learn both facial structures and texture details. Finally, we
integrate them into an optimized end-to-end training pipeline named ADNet. Our
ADNet achieves state-of-the-art results on 300W, WFLW and COFW datasets, which
demonstrates the effectiveness and robustness.
- Abstract(参考訳): CNNの最近の進歩は、顔アライメントのパフォーマンスを劇的に改善した。
しかし、顔のランドマークの誤差分布に関して、誤りバイアスに注意を払っている作品はほとんどない。
本稿では,ランドマーク誤差の分布が接線に沿って,ランドマーク曲線に拡がる傾向がある面アライメントにおける誤差バイアス問題について検討する。
このエラーバイアスはあいまいなランドマークラベリングタスクと密接な関係があるため、自明ではない。
この観測から着想を得た我々は,CNNモデルのより良い収束のためにエラーバイアス特性を活用する方法を模索する。
この目的のために, 座標と熱マップの回帰のための異方性方向損失 (ADL) と異方性注意モジュール (AAM) を提案する。
adlは顔境界のランドマークポイントごとに通常の方向に強い結合力を課している。
一方、AAMは、点の領域とその隣接点で連結された局所エッジに焦点をあてた異方性アテンションマスクを得られるアテンションモジュールであり、接点の応答は通常のものよりも強く、接点の制約は緩和される。
これらの2つの手法は、顔の構造とテクスチャの詳細を相補的に学習する。
最後に、adnetと呼ばれる最適化されたエンドツーエンドのトレーニングパイプラインに統合します。
我々のADNetは300W、WFLW、COFWのデータセットで最先端の結果を達成し、その有効性と堅牢性を示す。
関連論文リスト
- Revisiting Edge Perturbation for Graph Neural Network in Graph Data
Augmentation and Attack [58.440711902319855]
エッジ摂動はグラフ構造を変更する方法である。
グラフニューラルネットワーク(GNN)の性能への影響に基づき、2つの静脈に分類できる。
統一的な定式化を提案し、エッジ摂動法の2つのカテゴリ間の明確な境界を確立する。
論文 参考訳(メタデータ) (2024-03-10T15:50:04Z) - Parallel Vertex Diffusion for Unified Visual Grounding [38.94276071029081]
統一ビジュアルグラウンドティングは、タスク固有の設計の少ないマルチタスクデータを活用するためのシンプルで汎用的な技術経路を追求する。
ほとんどの先進的な手法は、通常、検出とセグメンテーションをモデル化するためのシーケンスとしてボックスとマスクを提示する。
論文 参考訳(メタデータ) (2023-03-13T15:51:38Z) - Kernel-Whitening: Overcome Dataset Bias with Isotropic Sentence
Embedding [51.48582649050054]
符号化文の特徴間の相関関係を解消する表現正規化手法を提案する。
またNystromカーネル近似法であるKernel-Whiteningを提案する。
実験により,Kernel-Whiteningは分布内精度を維持しつつ,分布外データセット上でのBERTの性能を著しく向上することが示された。
論文 参考訳(メタデータ) (2022-10-14T05:56:38Z) - Feature Space Targeted Attacks by Statistic Alignment [74.40447383387574]
特徴空間ターゲットは、中間特徴写像を変調して摂動画像を攻撃する。
画素ワイドユークリッド距離の現在の選択は、ソースとターゲットの特徴に不合理に空間整合性制約を課すため、不一致を測定することが疑問視されている。
本稿では,Pair-wise Alignment AttackとGlobal-wise Alignment Attackという2つの新しい手法を提案する。
論文 参考訳(メタデータ) (2021-05-25T03:46:39Z) - Directional Graph Networks [17.11861614285746]
グラフニューラルネットワーク(GNN)のための最初の一貫した異方性カーネルを提案する。
グラフ内のベクトル場を定義することにより、方向微分を適用し、ノード固有のメッセージをフィールドに投影することで滑らか化する方法を開発する。
本手法はCNNを$n$次元の格子上に一般化し,標準のGNNよりも明らかに差別的であることを示す。
論文 参考訳(メタデータ) (2020-10-06T16:31:27Z) - PropagationNet: Propagate Points to Curve to Learn Structure Information [79.65125870257009]
熱マップ回帰に基づく構造注入型顔アライメントアルゴリズムを提案する。
また,地中条件下での採鉱・採鉱の難しさを強調したFocal Wing Lossを提案する。
提案手法では,WFLWでは平均誤差が4.05%,300Wでは平均誤差が2.93%,COFWでは平均誤差が3.71%となる。
論文 参考訳(メタデータ) (2020-06-25T11:08:59Z) - Unsupervised Performance Analysis of 3D Face Alignment with a
Statistically Robust Confidence Test [32.43769049247355]
本稿では3次元顔アライメント(3DFA)の性能解析の問題点について述べる。
提案手法の中核となる要素は、予測されたランドマークとモデルランドマークの間の剛性変換の頑健な評価である。
その結果、提案手法は教師付きメトリクスと一致しており、予測されたランドマークと自動アノテーション付き3DFAデータセットの精度を測定できることがわかった。
論文 参考訳(メタデータ) (2020-04-14T14:33:57Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z) - On the Arbitrary-Oriented Object Detection: Classification based
Approaches Revisited [94.5455251250471]
まず,既存の回帰型回転検出器が抱える境界問題は,角周期性や角秩序によって引き起こされることを示した。
我々は、角予測タスクを回帰問題から分類問題に変換する。
得られた円形分布角分類問題に対して、まず、角度の周期性に対処し、隣り合う角度に対する誤差耐性を高めるために、円スムースラベル法を考案する。
論文 参考訳(メタデータ) (2020-03-12T03:23:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。