論文の概要: NIR-to-VIS Face Recognition via Embedding Relations and Coordinates of
the Pairwise Features
- arxiv url: http://arxiv.org/abs/2208.02417v1
- Date: Thu, 4 Aug 2022 02:53:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-08-05 12:34:54.192278
- Title: NIR-to-VIS Face Recognition via Embedding Relations and Coordinates of
the Pairwise Features
- Title(参考訳): 埋め込み関係とペアワイズ特徴のコーディネートによるNIR-to-VIS顔認識
- Authors: MyeongAh Cho, Tae-young Chun, g Taeoh Kim, Sangyoun Lee
- Abstract要約: 顔認識モデルに簡単に追加可能な'Relation Module'を提案する。
顔画像から抽出された局所特徴は、顔の各成分の情報を含む。
提案モジュールでは14.81%のランク-1精度と15.47%の検証率で0.1%のFAR改善を実現した。
- 参考スコア(独自算出の注目度): 5.044100238869375
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: NIR-to-VIS face recognition is identifying faces of two different domains by
extracting domain-invariant features. However, this is a challenging problem
due to the two different domain characteristics, and the lack of NIR face
dataset. In order to reduce domain discrepancy while using the existing face
recognition models, we propose a 'Relation Module' which can simply add-on to
any face recognition models. The local features extracted from face image
contain information of each component of the face. Based on two different
domain characteristics, to use the relationships between local features is more
domain-invariant than to use it as it is. In addition to these relationships,
positional information such as distance from lips to chin or eye to eye, also
provides domain-invariant information. In our Relation Module, Relation Layer
implicitly captures relationships, and Coordinates Layer models the positional
information. Also, our proposed Triplet loss with conditional margin reduces
intra-class variation in training, and resulting in additional performance
improvements. Different from the general face recognition models, our add-on
module does not need to pre-train with the large scale dataset. The proposed
module fine-tuned only with CASIA NIR-VIS 2.0 database. With the proposed
module, we achieve 14.81% rank-1 accuracy and 15.47% verification rate of 0.1%
FAR improvements compare to two baseline models.
- Abstract(参考訳): NIR-to-VIS顔認識は、ドメイン不変の特徴を抽出することにより、2つの異なるドメインの顔を特定する。
しかし、2つの異なるドメイン特性と、NIRの顔データセットがないため、これは難しい問題である。
既存の顔認識モデルを用いた場合のドメイン差を低減するために,任意の顔認識モデルに簡単に追加可能な'Relation Module'を提案する。
顔画像から抽出された局所特徴は、顔の各成分の情報を含む。
2つの異なるドメイン特性に基づいて、ローカル機能間の関係を使うのは、そのまま使うよりもドメイン不変である。
これらの関係に加えて、唇から顎までの距離や目から目までの位置情報もドメイン不変の情報を提供する。
関連モジュールでは,関係層が暗黙的に関係を捉え,関係層が位置情報をモデル化する。
また,条件付きマージンによる三重項損失により,クラス内トレーニングのばらつきが減少し,さらにパフォーマンスが向上した。
一般的な顔認識モデルとは異なり、当社のアドオンモジュールは大規模なデータセットで事前トレーニングする必要はない。
提案されたモジュールはCAIA NIR-VIS 2.0データベースでのみ微調整された。
提案モジュールでは,2つのベースラインモデルと比較して14.81%のランク-1精度と15.47%の検証率を達成した。
関連論文リスト
- Learning multi-domain feature relation for visible and Long-wave
Infrared image patch matching [39.88037892637296]
我々は、VL-CMIMと呼ばれる最大の可視・長波長赤外線画像パッチマッチングデータセットを提示する。
さらに,マルチドメイン特徴関連学習ネットワーク(MD-FRN)を提案する。
論文 参考訳(メタデータ) (2023-08-09T11:23:32Z) - Adaptive Face Recognition Using Adversarial Information Network [57.29464116557734]
顔認識モデルは、トレーニングデータがテストデータと異なる場合、しばしば退化する。
本稿では,新たな敵情報ネットワーク(AIN)を提案する。
論文 参考訳(メタデータ) (2023-05-23T02:14:11Z) - Part-guided Relational Transformers for Fine-grained Visual Recognition [59.20531172172135]
識別的特徴を学習し,特徴変換モジュールとの相関関係を探索するフレームワークを提案する。
提案手法は,3-of-the-levelオブジェクト認識において,部分ブランチの追加に頼らず,最先端の性能に達する。
論文 参考訳(メタデータ) (2022-12-28T03:45:56Z) - Decoupled Multi-task Learning with Cyclical Self-Regulation for Face
Parsing [71.19528222206088]
顔解析のための周期的自己統制型デカップリング型マルチタスク学習を提案する。
具体的には、DML-CSRは、顔解析、バイナリエッジ、カテゴリエッジ検出を含むマルチタスクモデルを設計する。
提案手法は,Helen,CelebA-HQ,LapaMaskのデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-28T02:12:30Z) - BDA-SketRet: Bi-Level Domain Adaptation for Zero-Shot SBIR [52.78253400327191]
BDA-SketRetは、視覚データペアの空間的特徴と意味的特徴を整合させるために、バイレベルドメイン適応を実行する新しいフレームワークである。
拡張されたSketchy、TU-Berlin、QuickDrawの実験結果は、文献よりも大幅に改善された。
論文 参考訳(メタデータ) (2022-01-17T18:45:55Z) - A NIR-to-VIS face recognition via part adaptive and relation attention
module [4.822208985805956]
顔認識アプリケーションでは、夜間に近赤外線(NIR)監視カメラで撮影するなど、様々な状況下で撮影された顔画像を処理する必要がある。
NIRと可視光(VIS)の照度の違いは、顔画像の領域差を引き起こし、ポーズや感情の変化も顔のマッチングを難しくする。
本稿では,セマンティックマスクを用いて得られた顔の部位を抽出し,それぞれの特徴を用いた関係モデリングを行う部分関係アテンションモジュールを提案する。
論文 参考訳(メタデータ) (2021-02-01T08:13:39Z) - Semantic Change Detection with Asymmetric Siamese Networks [71.28665116793138]
2つの空中画像が与えられた場合、セマンティックチェンジ検出は、土地被覆のバリエーションを特定し、それらの変化タイプをピクセルワイド境界で識別することを目的としている。
この問題は、正確な都市計画や天然資源管理など、多くの地球ビジョンに関連するタスクにおいて不可欠である。
本研究では, 広く異なる構造を持つモジュールから得られた特徴対を用いて意味変化を同定し, 同定するための非対称システマネットワーク(ASN)を提案する。
論文 参考訳(メタデータ) (2020-10-12T13:26:30Z) - DBLFace: Domain-Based Labels for NIR-VIS Heterogeneous Face Recognition [5.076419064097733]
ドメインベースラベルフェイス(Domain-Based Label Face、DBLFace)は、対象が単一のラベルではなくラベルの集合によって表されるという仮定に基づく学習手法である。
特に、NIR画像とVIS画像の2つのラベルセットを用いて、NIR-VIS顔認識モデルのトレーニングを行う。
DBLFaceはEDGE20データセットでランク1の識別率を6.7%向上させ、CASIA NIR-VIS 2.0データセットで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2020-10-08T05:22:47Z) - Multi-Margin based Decorrelation Learning for Heterogeneous Face
Recognition [90.26023388850771]
本稿では,超球面空間におけるデコリレーション表現を抽出するディープニューラルネットワーク手法を提案する。
提案するフレームワークは,不均一表現ネットワークとデコリレーション表現学習の2つのコンポーネントに分けることができる。
2つの難解な異種顔データベースに対する実験結果から,本手法は検証タスクと認識タスクの両方において優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2020-05-25T07:01:12Z) - Associating Multi-Scale Receptive Fields for Fine-grained Recognition [5.079292308180334]
マルチスケールの受容場を2つの操作で関連付けるために,新しい多層非局所(CNL)モジュールを提案する。
CNLはクエリ層とすべてのレスポンス層の間の相関を計算する。
モデルでは,多層層間の空間的依存関係を構築し,より識別的な特徴を学習する。
論文 参考訳(メタデータ) (2020-05-19T01:16:31Z) - Relational Deep Feature Learning for Heterogeneous Face Recognition [17.494718795454055]
一般的な顔の特徴に加えて,グローバルな関係情報を抽出するグラフモジュール (Graph Module, NIR) を提案する。
提案手法は,5つの異種顔認識(HFR)データベースにおいて,他の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-03-02T07:35:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。