論文の概要: BioMetricNet: deep unconstrained face verification through learning of
metrics regularized onto Gaussian distributions
- arxiv url: http://arxiv.org/abs/2008.06021v1
- Date: Thu, 13 Aug 2020 17:22:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-30 22:47:36.313345
- Title: BioMetricNet: deep unconstrained face verification through learning of
metrics regularized onto Gaussian distributions
- Title(参考訳): BioMetricNet: ガウス分布に正規化されたメトリクスの学習による深層非拘束顔認証
- Authors: Arslan Ali, Matteo Testa, Tiziano Bianchi, Enrico Magli
- Abstract要約: 深層非拘束顔認証のための新しいフレームワークであるBioMetricNetを提案する。
提案手法では、顔の特徴について具体的な指標を課していない。
マッチングと非マッチングのペアを、明確に分離された、よく定義されたターゲット分布にマッピングする潜在表現を学習することで、決定空間を形成する。
- 参考スコア(独自算出の注目度): 25.00475462213752
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present BioMetricNet: a novel framework for deep unconstrained face
verification which learns a regularized metric to compare facial features.
Differently from popular methods such as FaceNet, the proposed approach does
not impose any specific metric on facial features; instead, it shapes the
decision space by learning a latent representation in which matching and
non-matching pairs are mapped onto clearly separated and well-behaved target
distributions. In particular, the network jointly learns the best feature
representation, and the best metric that follows the target distributions, to
be used to discriminate face images. In this paper we present this general
framework, first of its kind for facial verification, and tailor it to Gaussian
distributions. This choice enables the use of a simple linear decision boundary
that can be tuned to achieve the desired trade-off between false alarm and
genuine acceptance rate, and leads to a loss function that can be written in
closed form. Extensive analysis and experimentation on publicly available
datasets such as Labeled Faces in the wild (LFW), Youtube faces (YTF),
Celebrities in Frontal-Profile in the Wild (CFP), and challenging datasets like
cross-age LFW (CALFW), cross-pose LFW (CPLFW), In-the-wild Age Dataset (AgeDB)
show a significant performance improvement and confirms the effectiveness and
superiority of BioMetricNet over existing state-of-the-art methods.
- Abstract(参考訳): 我々は,顔の特徴を比較するための正規化メトリクスを学習する,深層非拘束顔認証のための新しいフレームワークであるBioMetricNetを提案する。
FaceNetのような一般的な手法とは異なり、提案手法は顔の特徴に特定の指標を課さない。代わりに、マッチングと非マッチングのペアが明確に分離され、良好な目標分布にマッピングされる潜在表現を学習することで、決定空間を形成する。
特に、ネットワークは、顔画像の識別に使用される最適な特徴表現と、対象の分布に従う最良の指標を共同で学習する。
本稿では、まず、顔認証のための一般的な枠組みを示し、それをガウス分布に合わせる。
この選択は、偽アラームと真の受容率の間の所望のトレードオフを達成するために調整できる単純な線形決定境界を使用することを可能にし、クローズド形式で書ける損失関数をもたらす。
野生のラベル付き顔(LFW)、Youtube Face(YTF)、Frontal-Profile in the Wild(CFP)、クロスエイジLFW(CALFW)、クロスフェイズLFW(CPLFW)、In-the-wild Age Dataset(AgeDB)といった公開データセットの大規模な分析と実験により、既存の最先端メソッドよりもBioMetricNetの有効性と優位性が確認されている。
関連論文リスト
- MFCLIP: Multi-modal Fine-grained CLIP for Generalizable Diffusion Face Forgery Detection [64.29452783056253]
フォトリアリスティック・フェイスジェネレーション手法の急速な発展は、社会やアカデミックにおいて大きな関心を集めている。
既存のアプローチは主に画像モダリティを用いて顔の偽造パターンをキャプチャするが、きめ細かいノイズやテキストのような他のモダリティは完全には探索されていない。
そこで本研究では,画像ノイズの多点にわたる包括的かつきめ細かなフォージェリートレースをマイニングする,MFCLIP(MF-modal Fine-fine-fine-fine-fine-fine CLIP)モデルを提案する。
論文 参考訳(メタデータ) (2024-09-15T13:08:59Z) - Generalizable Facial Expression Recognition [41.639746139849564]
SOTA顔表情認識(FER)メソッドは、列車セットとドメインギャップのあるテストセットで失敗する。
最近の領域適応FER法は、ferモデルを微調整するために、ターゲットドメインのラベル付きまたは未ラベルのサンプルを取得する必要がある。
本稿では,1つの列車セットのみを用いて,異なる未確認テストセット上でのFER法のゼロショット一般化能力を改善することを目的とする。
論文 参考訳(メタデータ) (2024-08-20T07:48:45Z) - Semi-supervised Semantic Segmentation Meets Masked Modeling:Fine-grained
Locality Learning Matters in Consistency Regularization [31.333862320143968]
半教師付きセマンティックセグメンテーションはラベル付き画像と豊富なラベル付き画像を利用してラベル効率の高い学習を実現することを目的としている。
我々は,より詳細な局所性学習により,より高密度なセグメンテーションを実現する,textttMaskMatchという新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-14T03:28:53Z) - Open-Set Face Recognition with Maximal Entropy and Objectosphere Loss [7.710785884166695]
この作業は、低い偽陽性識別率で動作することが期待されるオープンセットタスクであるウォッチリストに集中する。
コスト関数と組み合わせることで、付加的な負の顔画像の利点を享受できるコンパクトなアダプタネットワークを導入する。
提案手法では,顔認識を特徴抽出器として,事前学習したディープニューラルネットワーク(DNN)を採用する。
論文 参考訳(メタデータ) (2023-11-01T09:52:02Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Towards General Visual-Linguistic Face Forgery Detection [95.73987327101143]
ディープフェイクは現実的な顔操作であり、セキュリティ、プライバシー、信頼に深刻な脅威をもたらす可能性がある。
既存の方法は、このタスクを、デジタルラベルまたはマスク信号を使用して検出モデルをトレーニングするバイナリ分類として扱う。
本稿では, 微粒な文レベルのプロンプトをアノテーションとして用いた, VLFFD (Visual-Linguistic Face Forgery Detection) という新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2023-07-31T10:22:33Z) - Adaptive Face Recognition Using Adversarial Information Network [57.29464116557734]
顔認識モデルは、トレーニングデータがテストデータと異なる場合、しばしば退化する。
本稿では,新たな敵情報ネットワーク(AIN)を提案する。
論文 参考訳(メタデータ) (2023-05-23T02:14:11Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Exploiting Shape Cues for Weakly Supervised Semantic Segmentation [15.791415215216029]
弱教師付きセマンティックセマンティックセグメンテーション (WSSS) は、画像レベルのラベルのみをトレーニング用として、画素単位のクラス予測を生成することを目的としている。
畳み込みニューラルネットワーク(CNN)のテクスチャバイアス特性を補うために形状情報を活用することを提案する。
我々は、クラスと色親和性の両方を考慮した新しい改良手法により、オンライン方式で予測をさらに洗練する。
論文 参考訳(メタデータ) (2022-08-08T17:25:31Z) - Federated Learning for Face Recognition with Gradient Correction [52.896286647898386]
本稿では,顔認識のためのフェデレーション学習に取り組むためのフレームワークであるFedGCを紹介する。
我々は,FedGCが標準ソフトマックスと同様の損失関数を構成することを示す。
論文 参考訳(メタデータ) (2021-12-14T09:19:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。