論文の概要: MultiFace: A Generic Training Mechanism for Boosting Face Recognition
Performance
- arxiv url: http://arxiv.org/abs/2101.09899v2
- Date: Sun, 31 Jan 2021 13:05:46 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-14 19:06:55.079956
- Title: MultiFace: A Generic Training Mechanism for Boosting Face Recognition
Performance
- Title(参考訳): MultiFace: 顔認識性能向上のためのジェネリックトレーニングメカニズム
- Authors: Jing Xu, Tszhang Guo, Zenglin Xu, Kun Bai
- Abstract要約: MultiFaceと呼ばれるシンプルで効率的なトレーニングメカニズムを提案します。
元の高次元特徴を低次元特徴のアンサンブルによって近似する。
これはクラスタリング効果を通じてFRモデルに優れた解釈可能性の利点をもたらす。
- 参考スコア(独自算出の注目度): 26.207302802393684
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep Convolutional Neural Networks (DCNNs) and their variants have been
widely used in large scale face recognition(FR) recently. Existing methods have
achieved good performance on many FR benchmarks. However, most of them suffer
from two major problems. First, these methods converge quite slowly since they
optimize the loss functions in a high-dimensional and sparse Gaussian Sphere.
Second, the high dimensionality of features, despite the powerful descriptive
ability, brings difficulty to the optimization, which may lead to a sub-optimal
local optimum. To address these problems, we propose a simple yet efficient
training mechanism called MultiFace, where we approximate the original
high-dimensional features by the ensemble of low-dimensional features. The
proposed mechanism is also generic and can be easily applied to many advanced
FR models. Moreover, it brings the benefits of good interpretability to FR
models via the clustering effect. In detail, the ensemble of these
low-dimensional features can capture complementary yet discriminative
information, which can increase the intra-class compactness and inter-class
separability. Experimental results show that the proposed mechanism can
accelerate 2-3 times with the softmax loss and 1.2-1.5 times with Arcface or
Cosface, while achieving state-of-the-art performances in several benchmark
datasets. Especially, the significant improvements on large-scale
datasets(e.g., IJB and MageFace) demonstrate the flexibility of our new
training mechanism.
- Abstract(参考訳): 深層畳み込みニューラルネットワーク(DCNN)とその変種は近年,大規模顔認識(FR)で広く利用されている。
既存のメソッドは多くのFRベンチマークで優れたパフォーマンスを達成している。
しかし、そのほとんどが2つの大きな問題を抱えている。
まず、これらの手法は高次元でスパースなガウス球面における損失関数を最適化するため、非常にゆっくりと収束する。
第二に、強力な記述能力にもかかわらず、特徴の高次元性は最適化に困難をもたらし、これは準最適局所最適化につながる可能性がある。
そこで本研究では, 低次元特徴のアンサンブルにより, 本来の高次元特徴を近似する, 簡便かつ効率的な訓練機構MultiFaceを提案する。
提案機構は汎用的であり、多くの高度なFRモデルにも容易に適用できる。
さらに、クラスタリング効果を介してFRモデルに優れた解釈性の利点をもたらします。
詳しくは、これらの低次元特徴のアンサンブルは相補的かつ判別的な情報を捉えることができ、クラス内コンパクト性とクラス間分離性を高めることができる。
実験結果から,本機構はソフトマックス損失で2~3倍,アークフェイスやコスフェイスで1.2~1.5倍の高速化が可能であり,ベンチマークデータセットでは最先端の性能が得られることがわかった。
特に、大規模データセット(IJBやMageFaceなど)の大幅な改善は、新しいトレーニングメカニズムの柔軟性を示しています。
関連論文リスト
- Trading-off Mutual Information on Feature Aggregation for Face
Recognition [12.803514943105657]
本稿では、2つの最先端(SOTA)深層顔認識(FR)モデルの出力を集約する手法を提案する。
提案手法では,2つの特徴写像の異なる部分間の関係を利用するために,変圧器の注意機構を利用する。
提案手法の有効性を評価するため,一般的なベンチマーク実験を行い,その結果を最先端のアルゴリズムと比較した。
論文 参考訳(メタデータ) (2023-09-22T18:48:38Z) - SubFace: Learning with Softmax Approximation for Face Recognition [3.262192371833866]
SubFaceは、サブスペース機能を利用して顔認識の性能を向上するソフトマックス近似法である。
本手法がバニラCNNベースラインの性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2022-08-24T12:31:08Z) - SFace: Sigmoid-Constrained Hypersphere Loss for Robust Face Recognition [74.13631562652836]
SFace(Sigmoid-Constrained hypersphere loss)と呼ばれる新しい損失関数を提案する。
SFaceは2つのシグモイド勾配再スケール関数によってそれぞれ制御される超球面多様体にクラス内およびクラス間制約を課す。
クラス内距離を減らし、ラベルノイズへの過度な適合を防ぎ、より堅牢なディープ顔認識モデルに寄与する。
論文 参考訳(メタデータ) (2022-05-24T11:54:15Z) - Residual Local Feature Network for Efficient Super-Resolution [20.62809970985125]
本研究では,Residual Local Feature Network (RLFN)を提案する。
主なアイデアは、3つの畳み込みレイヤを局所的な特徴学習に使用して、機能の集約を単純化することだ。
さらに,NTIRE 2022の高効率超解像問題において,第1位を獲得した。
論文 参考訳(メタデータ) (2022-05-16T08:46:34Z) - EV-VGCNN: A Voxel Graph CNN for Event-based Object Classification [18.154951807178943]
イベントカメラは、少ない強度変化を報告し、ポータブルデバイス上での視覚知覚と理解のための低消費電力、高ダイナミックレンジ、高応答速度の顕著な利点を目立たせる。
イベントベースの学習手法は、従来の2次元学習アルゴリズムを適用するために、イベントを密度の高いフレームベースの表現に統合することで、オブジェクト認識において大きな成功を収めている。
これらのアプローチは、スパース・トゥ・ディエンス変換の期間中に多くの冗長な情報を導入し、重量と大容量のモデルを必要とするため、リアルタイムアプリケーションにおけるイベントカメラの可能性を制限する。
論文 参考訳(メタデータ) (2021-06-01T04:07:03Z) - Lightweight Single-Image Super-Resolution Network with Attentive
Auxiliary Feature Learning [73.75457731689858]
本稿では,SISR の注意補助機能 (A$2$F) に基づく計算効率が高く正確なネットワークを構築した。
大規模データセットを用いた実験結果から,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2020-11-13T06:01:46Z) - Optimization-driven Machine Learning for Intelligent Reflecting Surfaces
Assisted Wireless Networks [82.33619654835348]
インテリジェントサーフェス(IRS)は、個々の散乱素子の位相シフトを制御して無線チャネルを再形成するために用いられる。
散乱素子の規模が大きいため、受動ビームフォーミングは一般に高い計算複雑性によって挑戦される。
本稿では、IRS支援無線ネットワークの性能向上のための機械学習(ML)アプローチに焦点を当てる。
論文 参考訳(メタデータ) (2020-08-29T08:39:43Z) - A Generic Network Compression Framework for Sequential Recommender
Systems [71.81962915192022]
シークエンシャルレコメンデーションシステム(SRS)は,ユーザの動的関心を捉え,高品質なレコメンデーションを生成する上で重要な技術となっている。
CpRecと呼ばれる圧縮されたシーケンシャルレコメンデーションフレームワークを提案する。
大規模なアブレーション研究により、提案したCpRecは実世界のSRSデータセットにおいて最大4$sim$8倍の圧縮速度を達成できることを示した。
論文 参考訳(メタデータ) (2020-04-21T08:40:55Z) - ASFD: Automatic and Scalable Face Detector [129.82350993748258]
ASFD(Automatic and Scalable Face Detector)を提案する。
ASFDはニューラルアーキテクチャ検索技術の組み合わせと新たな損失設計に基づいている。
ASFD-D0は120FPS以上で動作し、MobilenetはVGA解像度の画像を撮影しています。
論文 参考訳(メタデータ) (2020-03-25T06:00:47Z) - Spatial-Spectral Residual Network for Hyperspectral Image
Super-Resolution [82.1739023587565]
ハイパースペクトル画像超解像のための新しいスペクトル空間残差ネットワーク(SSRNet)を提案する。
提案手法は,2次元畳み込みではなく3次元畳み込みを用いて空間スペクトル情報の探索を効果的に行うことができる。
各ユニットでは空間的・時間的分離可能な3次元畳み込みを用いて空間的・スペクトル的な情報を抽出する。
論文 参考訳(メタデータ) (2020-01-14T03:34:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。