論文の概要: Semi-Siamese Training for Shallow Face Learning
- arxiv url: http://arxiv.org/abs/2007.08398v1
- Date: Thu, 16 Jul 2020 15:20:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-09 23:35:04.892031
- Title: Semi-Siamese Training for Shallow Face Learning
- Title(参考訳): 浅層顔学習のためのセミシアム学習
- Authors: Hang Du, Hailin Shi, Yuchi Liu, Jun Wang, Zhen Lei, Dan Zeng, Tao Mei
- Abstract要約: セミ・シームズ・トレーニング(SST)という新しいトレーニング手法を導入する。
一対のセミ・シームズネットワークが前方伝播構造を構成し、トレーニング損失を更新ギャラリーキューで計算する。
提案手法は外部依存を伴わずに開発されており,既存の損失関数やネットワークアーキテクチャと柔軟に統合することができる。
- 参考スコア(独自算出の注目度): 78.7386209619276
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most existing public face datasets, such as MS-Celeb-1M and VGGFace2, provide
abundant information in both breadth (large number of IDs) and depth
(sufficient number of samples) for training. However, in many real-world
scenarios of face recognition, the training dataset is limited in depth, i.e.
only two face images are available for each ID. $\textit{We define this
situation as Shallow Face Learning, and find it problematic with existing
training methods.}$ Unlike deep face data, the shallow face data lacks
intra-class diversity. As such, it can lead to collapse of feature dimension
and consequently the learned network can easily suffer from degeneration and
over-fitting in the collapsed dimension. In this paper, we aim to address the
problem by introducing a novel training method named Semi-Siamese Training
(SST). A pair of Semi-Siamese networks constitute the forward propagation
structure, and the training loss is computed with an updating gallery queue,
conducting effective optimization on shallow training data. Our method is
developed without extra-dependency, thus can be flexibly integrated with the
existing loss functions and network architectures. Extensive experiments on
various benchmarks of face recognition show the proposed method significantly
improves the training, not only in shallow face learning, but also for
conventional deep face data.
- Abstract(参考訳): MS-Celeb-1MやVGGFace2のような既存の公開顔データセットは、トレーニング用の幅(大きなID数)と深さ(十分なサンプル数)の両方で豊富な情報を提供する。
しかし、現実の顔認識の多くのシナリオでは、トレーニングデータセットは深さが限られており、各IDに対して2つの顔画像しか利用できない。
私たちはこの状況を浅い顔学習と定義し、既存のトレーニング方法に問題があることに気付きました。
ディープフェイスデータとは異なり、浅い顔データにはクラス内多様性が欠けている。
これにより特徴次元の崩壊を招き、学習ネットワークは崩壊次元の劣化や過度な適合に容易に苦しむことができる。
本稿では,SST(Semi-Siamese Training)と呼ばれる新しいトレーニング手法を導入することで,この問題に対処することを目的とする。
一対のセミ・シームズネットワークが前方伝播構造を構成し、トレーニング損失を更新ギャラリーキューで計算し、浅いトレーニングデータに対して効果的な最適化を行う。
提案手法は外部依存なしに開発され,既存の損失関数やネットワークアーキテクチャと柔軟に統合することができる。
提案手法は, 浅層学習だけでなく, 従来型深層顔データにおいても, 大規模に評価実験を行った結果, トレーニング精度が大幅に向上した。
関連論文リスト
- Towards Metrical Reconstruction of Human Faces [20.782425305421505]
顔の形状を学習するための教師付きトレーニングスキームについて論じる。
大規模な2次元画像データセットで事前訓練した顔認識ネットワークを利用する。
提案手法は,最先端の再建手法よりも大きなマージンで優れる。
論文 参考訳(メタデータ) (2022-04-13T18:57:33Z) - Multi-Agent Semi-Siamese Training for Long-tail and Shallow Face
Learning [54.13876727413492]
多くの現実世界の顔認識シナリオでは、トレーニングデータセットの深さは浅いため、IDごとに2つの顔画像しか利用できません。
非均一なサンプルの増加により、このような問題はより一般的なケース、すなわち長い尾の顔学習に変換される。
これらの問題に対処するために,マルチエージェントセミシアントレーニング(masst)という高度なソリューションを導入する。
広範な実験と比較は、長い尾と浅い顔学習のためのMASSTの利点を示しています。
論文 参考訳(メタデータ) (2021-05-10T04:57:32Z) - Recurrent Multi-view Alignment Network for Unsupervised Surface
Registration [79.72086524370819]
非厳格な登録をエンドツーエンドで学習することは、本質的に高い自由度とラベル付きトレーニングデータの欠如により困難である。
我々は、いくつかの剛性変換のポイントワイドな組み合わせで、非剛性変換を表現することを提案する。
また,投影された多視点2次元深度画像上での3次元形状の類似度を計測する可微分損失関数も導入する。
論文 参考訳(メタデータ) (2020-11-24T14:22:42Z) - Towards Universal Representation Learning for Deep Face Recognition [106.21744671876704]
対象のドメイン知識を活用せずに、与えられたトレーニングデータに見つからない大きな変化に対処できる普遍的な表現学習フレームワークを提案する。
実験により,LFW や MegaFace などの一般的な顔認識データセットにおいて,本手法が最高性能を実現することを示す。
論文 参考訳(メタデータ) (2020-02-26T23:29:57Z) - DotFAN: A Domain-transferred Face Augmentation Network for Pose and
Illumination Invariant Face Recognition [94.96686189033869]
本稿では,3次元モデルを用いたドメイン転送型顔強調ネットワーク(DotFAN)を提案する。
DotFANは、他のドメインから収集された既存のリッチフェイスデータセットから抽出された知識に基づいて、入力顔の一連の変種を生成することができる。
実験によると、DotFANは、クラス内の多様性を改善するために、小さな顔データセットを増やすのに有益である。
論文 参考訳(メタデータ) (2020-02-23T08:16:34Z) - Deep Multi-Facial Patches Aggregation Network For Facial Expression
Recognition [5.735035463793008]
深層多面的パッチアグリゲーションネットワークに基づく顔表情認識(FER)のアプローチを提案する。
ディープ機能は、ディープサブネットワークを使用して顔のパッチから学習され、表現分類のために1つのディープアーキテクチャに集約される。
論文 参考訳(メタデータ) (2020-02-20T17:57:06Z) - Joint Deep Learning of Facial Expression Synthesis and Recognition [97.19528464266824]
顔表情の合成と認識を効果的に行うための新しい統合深層学習法を提案する。
提案手法は, 2段階の学習手順を伴い, まず, 表情の異なる顔画像を生成するために, 表情合成生成対向ネットワーク (FESGAN) を事前訓練する。
実画像と合成画像間のデータバイアスの問題を軽減するために,新しい実データ誘導バックプロパゲーション(RDBP)アルゴリズムを用いたクラス内損失を提案する。
論文 参考訳(メタデータ) (2020-02-06T10:56:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。