論文の概要: Multistage Model for Robust Face Alignment Using Deep Neural Networks
- arxiv url: http://arxiv.org/abs/2002.01075v1
- Date: Tue, 4 Feb 2020 01:13:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-04 03:25:56.330651
- Title: Multistage Model for Robust Face Alignment Using Deep Neural Networks
- Title(参考訳): ディープニューラルネットワークを用いたロバスト顔アライメントの多段階モデル
- Authors: Huabin Wang and Rui Cheng and Jian Zhou and Liang Tao and Hon Keung
Kwan
- Abstract要約: 空間変換器ネットワーク,時間ガラスネットワーク,および模範的形状制約を利用する多段階モデルを提案する。
提案手法の他の最先端手法よりも優れた性能を示す実験を行った。
- 参考スコア(独自算出の注目度): 8.504539228134082
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: An ability to generalize unconstrained conditions such as severe occlusions
and large pose variations remains a challenging goal to achieve in face
alignment. In this paper, a multistage model based on deep neural networks is
proposed which takes advantage of spatial transformer networks, hourglass
networks and exemplar-based shape constraints. First, a spatial transformer -
generative adversarial network which consists of convolutional layers and
residual units is utilized to solve the initialization issues caused by face
detectors, such as rotation and scale variations, to obtain improved face
bounding boxes for face alignment. Then, stacked hourglass network is employed
to obtain preliminary locations of landmarks as well as their corresponding
scores. In addition, an exemplar-based shape dictionary is designed to
determine landmarks with low scores based on those with high scores. By
incorporating face shape constraints, misaligned landmarks caused by occlusions
or cluttered backgrounds can be considerably improved. Extensive experiments
based on challenging benchmark datasets are performed to demonstrate the
superior performance of the proposed method over other state-of-the-art
methods.
- Abstract(参考訳): 厳しいオクルージョンや大きなポーズのバリエーションのような制約のない条件を一般化する能力は、顔のアライメントで達成する上で難しい目標である。
本稿では,空間変換器ネットワーク,時間ガラスネットワーク,および模範的形状制約を生かした,深層ニューラルネットワークに基づく多段階モデルを提案する。
まず、畳み込み層と残留単位からなる空間変圧器生成逆ネットワークを用いて、顔検出器による初期化問題(回転やスケールの変動など)を解決し、顔アライメントのための顔境界ボックスの改善を図る。
そして、積み重ねられた砂時計ネットワークを用いてランドマークの予備位置と対応するスコアを取得する。
また,高得点者に基づいて低得点のランドマークを決定するために,exemplar-based shape dictionaryが設計されている。
顔形状制約を組み込むことにより、閉塞や散在した背景による不整合ランドマークを大幅に改善することができる。
提案手法は他の最先端手法よりも優れた性能を示すために,挑戦的ベンチマークデータセットに基づく広範囲な実験を行った。
関連論文リスト
- Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - Arbitrary-Scale Point Cloud Upsampling by Voxel-Based Network with
Latent Geometric-Consistent Learning [52.825441454264585]
Voxel-based Network (textbfPU-VoxelNet) を用いた任意のスケールのクラウド・アップサンプリング・フレームワークを提案する。
ボクセル表現から継承された完全性と規則性により、ボクセルベースのネットワークは3次元表面を近似する事前定義されたグリッド空間を提供することができる。
密度誘導グリッド再サンプリング法を開発し、高忠実度点を生成するとともに、サンプリング出力を効果的に回避する。
論文 参考訳(メタデータ) (2024-03-08T07:31:14Z) - Deformation-Invariant Neural Network and Its Applications in Distorted
Image Restoration and Analysis [8.009077765403287]
幾何学的歪みによって劣化した画像は、画像や物体認識などのコンピュータビジョンタスクにおいて重要な課題となる。
ディープラーニングに基づく画像モデルは通常、幾何学的に歪んだ画像に対して正確な性能を与えることができない。
本稿では、幾何学的に歪んだ画像の撮像タスクに対処するフレームワークである変形不変ニューラルネットワーク(DINN)を提案する。
論文 参考訳(メタデータ) (2023-10-04T08:01:36Z) - Iterative Soft Shrinkage Learning for Efficient Image Super-Resolution [91.3781512926942]
画像超解像(SR)は、CNNからトランスフォーマーアーキテクチャへの広範なニューラルネットワーク設計を目撃している。
本研究は,市販のネットワーク設計を生かし,基礎となる計算オーバーヘッドを低減するため,超高解像度イテレーションにおけるネットワークプルーニングの可能性について検討する。
本研究では, ランダムネットワークのスパース構造を最適化し, 重要でない重みを小さめに微調整することにより, 反復型軟収縮率(ISS-P)法を提案する。
論文 参考訳(メタデータ) (2023-03-16T21:06:13Z) - Parallax-Tolerant Unsupervised Deep Image Stitching [57.76737888499145]
本稿では,パララックス耐性の非教師あり深層画像縫合技術であるUDIS++を提案する。
まず,グローバルなホモグラフィから局所的な薄板スプライン運動への画像登録をモデル化するための,頑健で柔軟なワープを提案する。
本研究では, 縫合された画像をシームレスに合成し, シーム駆動合成マスクの教師なし学習を行うことを提案する。
論文 参考訳(メタデータ) (2023-02-16T10:40:55Z) - Sign-Agnostic CONet: Learning Implicit Surface Reconstructions by
Sign-Agnostic Optimization of Convolutional Occupancy Networks [39.65056638604885]
畳み込み型ネットワークの符号非依存最適化により暗黙的表面再構成を学習する。
この目標をシンプルで効果的な設計で効果的に達成できることを示す。
論文 参考訳(メタデータ) (2021-05-08T03:35:32Z) - ProAlignNet : Unsupervised Learning for Progressively Aligning Noisy
Contours [12.791313859673187]
ProAlignNetは、輪郭形状間の大規模なミスアライメントと複雑な変換を説明できる。
近接感度および局所形状依存類似度測定値の上界から導出される新しい損失関数を用いて学習する。
実世界の2つの応用において、提案したモデルは最先端の手法よりも一貫して優れている。
論文 参考訳(メタデータ) (2020-05-23T14:56:14Z) - Deep Semantic Matching with Foreground Detection and Cycle-Consistency [103.22976097225457]
深層ネットワークに基づく弱い教師付きセマンティックマッチングに対処する。
本研究では,背景乱れの影響を抑えるために,前景領域を明示的に推定する。
複数の画像にまたがって予測変換を強制し、幾何的に可視かつ一貫したサイクル一貫性の損失を発生させる。
論文 参考訳(メタデータ) (2020-03-31T22:38:09Z) - Beyond Dropout: Feature Map Distortion to Regularize Deep Neural
Networks [107.77595511218429]
本稿では,ディープニューラルネットワークの中間層に関連する実験的なRademacher複雑性について検討する。
上記の問題に対処するための特徴歪み法(Disout)を提案する。
より高い試験性能を有するディープニューラルネットワークを作製するための特徴写像歪みの優位性を解析し、実証した。
論文 参考訳(メタデータ) (2020-02-23T13:59:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。