論文の概要: PropagationNet: Propagate Points to Curve to Learn Structure Information
- arxiv url: http://arxiv.org/abs/2006.14308v1
- Date: Thu, 25 Jun 2020 11:08:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-17 04:05:37.013547
- Title: PropagationNet: Propagate Points to Curve to Learn Structure Information
- Title(参考訳): PropagationNet: 構造情報を学ぶためのポイントを伝搬する
- Authors: Xiehe Huang, Weihong Deng, Haifeng Shen, Xiubao Zhang, Jieping Ye
- Abstract要約: 熱マップ回帰に基づく構造注入型顔アライメントアルゴリズムを提案する。
また,地中条件下での採鉱・採鉱の難しさを強調したFocal Wing Lossを提案する。
提案手法では,WFLWでは平均誤差が4.05%,300Wでは平均誤差が2.93%,COFWでは平均誤差が3.71%となる。
- 参考スコア(独自算出の注目度): 79.65125870257009
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning technique has dramatically boosted the performance of face
alignment algorithms. However, due to large variability and lack of samples,
the alignment problem in unconstrained situations, \emph{e.g}\onedot large head
poses, exaggerated expression, and uneven illumination, is still largely
unsolved. In this paper, we explore the instincts and reasons behind our two
proposals, \emph{i.e}\onedot Propagation Module and Focal Wing Loss, to tackle
the problem. Concretely, we present a novel structure-infused face alignment
algorithm based on heatmap regression via propagating landmark heatmaps to
boundary heatmaps, which provide structure information for further attention
map generation. Moreover, we propose a Focal Wing Loss for mining and
emphasizing the difficult samples under in-the-wild condition. In addition, we
adopt methods like CoordConv and Anti-aliased CNN from other fields that
address the shift-variance problem of CNN for face alignment. When implementing
extensive experiments on different benchmarks, \emph{i.e}\onedot WFLW, 300W,
and COFW, our method outperforms state-of-the-arts by a significant margin. Our
proposed approach achieves 4.05\% mean error on WFLW, 2.93\% mean error on 300W
full-set, and 3.71\% mean error on COFW.
- Abstract(参考訳): ディープラーニング技術は、顔アライメントアルゴリズムのパフォーマンスを劇的に向上させた。
しかし、大きなばらつきとサンプルの欠如により、制約のない状況におけるアライメントの問題、 \emph{e.g}\onedot large head poses, exaggerated expression, and uneven illumination は未解決のままである。
本稿では,この問題に対処するための2つの提案である「emph{i.e}\onedot Propagation Module」と「focal Wing Loss」の本質と理由について考察する。
具体的には、ランドマークのヒートマップを境界のヒートマップに伝播させることにより、ヒートマップ回帰に基づく新しい構造注入顔アライメントアルゴリズムを提案する。
さらに,実地条件下での難試料の採掘と強調を行うため,焦点翼損失法を提案する。
さらに、顔アライメントのためのCNNのシフト分散問題に対処する他の分野から、CoordConv や Anti-aliased CNN などの手法を採用する。
異なるベンチマーク(emph{i.e}\onedot WFLW, 300W, COFW)で広範な実験を行う場合, 提案手法は最先端の手法よりも大幅に優れる。
提案手法は,wflwでは4.05\%平均誤差,300wフルセットでは2.93\%平均誤差,cofwでは3.71\%平均誤差を達成する。
関連論文リスト
- On the representation and methodology for wide and short range head pose
estimation [48.87319013701136]
頭部ポーズ推定(HPE)はコンピュータビジョンにおける問題である。
近年の応用には、全360度回転範囲の顔の分析が必要である。
半フロントケースとプロファイルケースを解く従来のアプローチは、フルローテーションケースには直接適用できない。
論文 参考訳(メタデータ) (2024-01-11T10:20:37Z) - LoLep: Single-View View Synthesis with Locally-Learned Planes and
Self-Attention Occlusion Inference [66.45326873274908]
本稿では,1枚のRGB画像から局所学習平面を回帰してシーンを正確に表現するLoLepを提案する。
MINEと比較して、LPIPSは4.8%-9.0%、RVは73.9%-83.5%である。
論文 参考訳(メタデータ) (2023-07-23T03:38:55Z) - Subpixel Heatmap Regression for Facial Landmark Localization [65.41270740933656]
熱マップ回帰法は、熱マップ符号化と復号処理の両方に関連する離散化による誤差に悩まされる。
本稿では,熱マップの符号化と復号化に基礎となる連続分布を利用した新しい手法を提案する。
我々のアプローチは、顔のランドマークのローカライゼーションに新しい最先端の結果を設定する複数のデータセット間で顕著な利得を提供する。
論文 参考訳(メタデータ) (2021-11-03T17:21:28Z) - ADNet: Leveraging Error-Bias Towards Normal Direction in Face Alignment [28.301603455377435]
顔のアライメントにおける誤差バイアスの問題について検討し、ランドマーク誤差の分布が接線に沿ってランドマーク曲線に広がる傾向にあることを示した。
この観測から着想を得た我々は,CNNモデルのより良い収束のためにエラーバイアス特性を活用する方法を模索する。
配向および熱マップ回帰のための異方性方向損失(ADL)と異方性注意モジュール(AAM)を提案する。
論文 参考訳(メタデータ) (2021-09-13T06:05:28Z) - Physics-Informed Graph Learning for Robust Fault Location in
Distribution Systems [2.984934409689467]
分散エネルギー資源の急速な成長は電力グリッドの不安定性を増大させる可能性がある。
有望な戦略の1つは、検出と位置によって異常事象(例えば障害)に効率的に応答するために電力網にデータを使用することである。
本稿では,2段階の物理インフォームドグラフ学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-07-05T21:18:37Z) - Sparse and Imperceptible Adversarial Attack via a Homotopy Algorithm [93.80082636284922]
少数の敵対的攻撃は、数ピクセルを摂動するだけでディープ・ネットワーク(DNN)を騙すことができる。
近年の取り組みは、他の等級のl_infty摂動と組み合わせている。
本稿では,空間的・神経的摂動に対処するホモトピーアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-06-10T20:11:36Z) - SDAN: Squared Deformable Alignment Network for Learning Misaligned
Optical Zoom [5.202871995038932]
ディープニューラルネットワーク(DNN)に基づく超解像アルゴリズムは、生成した画像の品質を大幅に改善した。
これらのアルゴリズムはしばしば、現実世界の超解像問題を扱う際に重要な成果物をもたらす。
この問題に対処するために、Squared Deformable Alignment Network (SDAN) を紹介します。
論文 参考訳(メタデータ) (2021-04-02T01:58:00Z) - Where, What, Whether: Multi-modal Learning Meets Pedestrian Detection [23.92066492219922]
歩行者検出タスクをtextbftextitWhere、textbftextitWhat、textbftextitWhetherに分解します。
広く使用されているデータセット(シティパーソンとカルテック)の最新の結果を実現します。
論文 参考訳(メタデータ) (2020-12-20T10:15:39Z) - ContourNet: Taking a Further Step toward Accurate Arbitrary-shaped Scene
Text Detection [147.10751375922035]
本研究では,シーンテキストの偽陽性と大規模分散を効果的に処理するContourNetを提案する。
本手法は,両方向の応答値の高い予測を出力するだけで,これらの偽陽性を効果的に抑制する。
論文 参考訳(メタデータ) (2020-04-10T08:15:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。