論文の概要: Robust Face Alignment by Multi-order High-precision Hourglass Network
- arxiv url: http://arxiv.org/abs/2010.08722v1
- Date: Sat, 17 Oct 2020 05:40:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-06 11:56:49.916892
- Title: Robust Face Alignment by Multi-order High-precision Hourglass Network
- Title(参考訳): 多次高精度フールグラスネットワークによるロバスト顔アライメント
- Authors: Jun Wan, Zhihui Lai, Jun Liu, Jie Zhou, Can Gao
- Abstract要約: 本稿では,熱マップサブピクセル回帰 (HSR) 法と多階クロスジオメトリ・アウェア (MCG) モデルを提案する。
HSR法は、よく設計されたサブピクセル検出損失(SDL)とサブピクセル検出技術(SDT)により、高精度なランドマーク検出を実現するために提案されている。
同時に、MCGモデルは、提案した多階交差情報を用いて、顔の幾何学的制約と文脈情報を強化するためのより識別的な表現を学習することができる。
- 参考スコア(独自算出の注目度): 44.94500006611075
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Heatmap regression (HR) has become one of the mainstream approaches for face
alignment and has obtained promising results under constrained environments.
However, when a face image suffers from large pose variations, heavy occlusions
and complicated illuminations, the performances of HR methods degrade greatly
due to the low resolutions of the generated landmark heatmaps and the exclusion
of important high-order information that can be used to learn more
discriminative features. To address the alignment problem for faces with
extremely large poses and heavy occlusions, this paper proposes a heatmap
subpixel regression (HSR) method and a multi-order cross geometry-aware (MCG)
model, which are seamlessly integrated into a novel multi-order high-precision
hourglass network (MHHN). The HSR method is proposed to achieve high-precision
landmark detection by a well-designed subpixel detection loss (SDL) and
subpixel detection technology (SDT). At the same time, the MCG model is able to
use the proposed multi-order cross information to learn more discriminative
representations for enhancing facial geometric constraints and context
information. To the best of our knowledge, this is the first study to explore
heatmap subpixel regression for robust and high-precision face alignment. The
experimental results from challenging benchmark datasets demonstrate that our
approach outperforms state-of-the-art methods in the literature.
- Abstract(参考訳): 熱マップ回帰(HR)は顔アライメントの主要なアプローチの一つとなり、制約された環境下で有望な結果を得た。
しかし、顔画像が大きなポーズ変化、重オクルージョン、複雑な照明に苦しむ場合、HR法の性能は、生成したランドマーク熱マップの解像度の低さと、より識別的な特徴を学習するのに使用できる重要な高次情報の排除により大幅に低下する。
極めて大きなポーズとヘビーオクルージョンを持つ顔のアライメント問題に対処するために,新しいマルチオーダー高精度時計ネットワーク(MHHN)にシームレスに統合されたヘアマップサブピクセル回帰(HSR)法と多階クロスジオメトリー・アウェア(MCG)モデルを提案する。
HSR法は、よく設計されたサブピクセル検出損失(SDL)とサブピクセル検出技術(SDT)を用いて、高精度なランドマーク検出を実現する。
同時に、MCGモデルは、提案した多階交差情報を用いて、顔の幾何学的制約と文脈情報を強化するためのより識別的な表現を学習することができる。
我々の知る限りでは、これは、堅牢で高精度な顔アライメントのためのヒートマップサブピクセルレグレッションを初めて探求する研究である。
ベンチマークデータセットの挑戦による実験結果から,本手法が文献の最先端手法より優れていることが示された。
関連論文リスト
- Multi-Head Attention Residual Unfolded Network for Model-Based Pansharpening [2.874893537471256]
展開融合法は、ディープラーニングの強力な表現能力とモデルベースアプローチの堅牢性を統合する。
本稿では,衛星画像融合のためのモデルに基づく深部展開手法を提案する。
PRISMA、Quickbird、WorldView2データセットの実験結果から、本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2024-09-04T13:05:00Z) - Meet-in-the-middle: Multi-scale upsampling and matching for
cross-resolution face recognition [8.330506641637793]
本稿では, 顔の超解像, 解像度マッチング, マルチスケールテンプレート蓄積を組み合わせ, 監視映像から顔を確実に認識する手法を提案する。
提案手法では、実際の監視画像のターゲットデータセットのトレーニングや微調整は不要である。
論文 参考訳(メタデータ) (2022-11-28T11:23:32Z) - Semantic Encoder Guided Generative Adversarial Face Ultra-Resolution
Network [15.102899995465041]
本稿では,セマンティックガイド付き生成逆顔超解像ネットワーク(SEGA-FURN)を提案する。
提案するネットワークは, 組込みセマンティクスを捕捉し, 対数学習を誘導する新しいセマンティクスエンコーダと, Residual in Internal Block (RIDB) という階層型アーキテクチャを用いた新しいジェネレータから構成される。
大規模顔データを用いた実験により,提案手法は優れた超解像結果が得られ,定性比較と定量的比較の両面で他の最先端手法よりも優れることが示された。
論文 参考訳(メタデータ) (2022-11-18T23:16:57Z) - Hierarchical Similarity Learning for Aliasing Suppression Image
Super-Resolution [64.15915577164894]
エイリアスの影響を抑制するために階層画像超解像ネットワーク(HSRNet)を提案する。
HSRNetは、他の作品よりも定量的かつ視覚的なパフォーマンスを向上し、エイリアスをより効果的に再送信する。
論文 参考訳(メタデータ) (2022-06-07T14:55:32Z) - Deep Posterior Distribution-based Embedding for Hyperspectral Image
Super-resolution [75.24345439401166]
本稿では,高スペクトル画像の高次元空間スペクトル情報を効率的に効率的に埋め込む方法について述べる。
我々は,HS埋め込みを,慎重に定義されたHS埋め込みイベントの集合の後方分布の近似として定式化する。
そして,提案手法を物理的に解釈可能なソース一貫性超解像フレームワークに組み込む。
3つの一般的なベンチマークデータセットに対する実験により、PDE-Netは最先端の手法よりも優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2022-05-30T06:59:01Z) - Uncertainty-Aware Deep Multi-View Photometric Stereo [100.97116470055273]
光度ステレオ(PS)は高周波表面の細部を復元するのに優れ、マルチビューステレオ(MVS)はPSによる低周波歪みを除去し、大域的な形状を維持するのに役立つ。
本稿では,PS と MVS の相補的強みを効果的に活用する手法を提案する。
我々は,不確実性を考慮したディープPSネットワークとディープMVSネットワークを用いて,画素ごとの表面の正規度と深さを推定する。
論文 参考訳(メタデータ) (2022-02-26T05:45:52Z) - High-resolution Depth Maps Imaging via Attention-based Hierarchical
Multi-modal Fusion [84.24973877109181]
誘導DSRのための新しい注意に基づく階層型マルチモーダル融合ネットワークを提案する。
本手法は,再現精度,動作速度,メモリ効率の点で最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-04T03:28:33Z) - Robust Facial Landmark Detection by Multi-order Multi-constraint Deep
Networks [35.19368350816032]
より強力な特徴相関と制約学習のためのマルチオーダーマルチ制約ディープネットワーク(MMDN)を提案する。
Inlicit Multi-order Correlated Geometry-Aware (IMCG) モデルを提案し,多次空間相関と多次チャネル相関を導入する。
説明確率に基づく境界適応回帰(EPBR)法は、グローバルな形状制約を強化するために開発されている。
論文 参考訳(メタデータ) (2020-12-09T09:11:47Z) - Pyramidal Edge-maps and Attention based Guided Thermal Super-resolution [28.798966778371145]
可視領域画像を用いた熱画像の誘導超解像(GSR)は、画像間のスペクトル範囲の違いにより困難である。
可視画像から抽出したピラミッド状エッジマップに基づくGSRの新しいアルゴリズムを提案する。
我々のモデルは、定量的にも定性的にも、最先端のGSR法よりも優れています。
論文 参考訳(メタデータ) (2020-03-13T12:11:26Z) - PULSE: Self-Supervised Photo Upsampling via Latent Space Exploration of
Generative Models [77.32079593577821]
PULSE (Photo Upsampling via Latent Space Exploration) は、それまで文献になかった解像度で高解像度でリアルな画像を生成する。
本手法は, 従来よりも高分解能, スケールファクターの知覚品質において, 最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-03-08T16:44:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。