論文の概要: Heterogeneous Face Recognition Using Domain Invariant Units
- arxiv url: http://arxiv.org/abs/2404.14343v1
- Date: Mon, 22 Apr 2024 16:58:37 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-23 13:17:55.174934
- Title: Heterogeneous Face Recognition Using Domain Invariant Units
- Title(参考訳): ドメイン不変単位を用いた不均一顔認証
- Authors: Anjith George, Sebastien Marcel,
- Abstract要約: 教師ネットワークとして事前訓練された顔認識モデルを用いてドメイン不変ネットワーク層(DIU)を学習する。
提案したDIUは、対照的な蒸留フレームワークを用いて、限られた量のペアトレーニングデータでも効果的に訓練することができる。
提案手法は、事前訓練されたモデルを強化する可能性があり、より広い範囲のデータに適応できる。
- 参考スコア(独自算出の注目度): 4.910937238451485
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Heterogeneous Face Recognition (HFR) aims to expand the applicability of Face Recognition (FR) systems to challenging scenarios, enabling the matching of face images across different domains, such as matching thermal images to visible spectra. However, the development of HFR systems is challenging because of the significant domain gap between modalities and the lack of availability of large-scale paired multi-channel data. In this work, we leverage a pretrained face recognition model as a teacher network to learn domaininvariant network layers called Domain-Invariant Units (DIU) to reduce the domain gap. The proposed DIU can be trained effectively even with a limited amount of paired training data, in a contrastive distillation framework. This proposed approach has the potential to enhance pretrained models, making them more adaptable to a wider range of variations in data. We extensively evaluate our approach on multiple challenging benchmarks, demonstrating superior performance compared to state-of-the-art methods.
- Abstract(参考訳): Heterogeneous Face Recognition (HFR) は、顔認識(FR)システムの適用性を挑戦シナリオに拡張することを目的としており、熱画像と可視スペクトルとのマッチングなど、さまざまな領域にわたる顔画像のマッチングを可能にする。
しかし、HFRシステムの開発は、モダリティと大規模ペアリングマルチチャネルデータの可用性の欠如の間に大きなドメインギャップがあるため、困難である。
本研究では,教師ネットワークとして事前訓練された顔認識モデルを用いて,ドメイン不変ユニット(Domain-Invariant Units,DIU)と呼ばれるドメイン不変ネットワーク層を学習し,ドメインギャップを低減する。
提案したDIUは、対照的な蒸留フレームワークを用いて、限られた量のペアトレーニングデータでも効果的に訓練することができる。
提案手法は、事前訓練されたモデルを強化する可能性があり、より広い範囲のデータに適応できる。
我々は、複数の挑戦的ベンチマークに対する我々のアプローチを広く評価し、最先端の手法と比較して優れた性能を示した。
関連論文リスト
- Modality Agnostic Heterogeneous Face Recognition with Switch Style Modulators [4.910937238451485]
推論中に複数のモーダルを扱えるモーダリティ非依存HFR法を訓練するための新しいフレームワークを提案する。
Switch Style Modulation Blocks (SSMB) と呼ばれる,計算効率のよい自動ルーティング機構を実装することで実現した。
提案したSSMBは、エンドツーエンドにトレーニングでき、事前訓練された顔認識モデルにシームレスに統合され、モダリティに依存しないHFRモデルに変換される。
論文 参考訳(メタデータ) (2024-07-11T16:21:48Z) - From Modalities to Styles: Rethinking the Domain Gap in Heterogeneous Face Recognition [4.910937238451485]
本研究では,既存の顔認識ネットワークにシームレスに適合する条件適応型インスタンス変調(CAIM)モジュールを提案する。
CAIMブロックは中間特徴写像を変調し、ソースモダリティのスタイルに効率よく適応し、ドメインギャップをブリッジする。
我々は,提案手法を様々な挑戦的HFRベンチマークで広く評価し,最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-04-22T15:00:51Z) - Fiducial Focus Augmentation for Facial Landmark Detection [4.433764381081446]
本稿では,モデルによる顔構造理解を高めるために,新しい画像強調手法を提案する。
我々は,Deep Canonical correlation Analysis (DCCA) に基づく損失を考慮した,シームズアーキテクチャに基づくトレーニング機構を採用している。
提案手法は,様々なベンチマークデータセットにおいて,最先端のアプローチよりも優れている。
論文 参考訳(メタデータ) (2024-02-23T01:34:00Z) - Towards Full-scene Domain Generalization in Multi-agent Collaborative
Bird's Eye View Segmentation for Connected and Autonomous Driving [54.60458503590669]
協調認識の学習段階と推論段階の両方に適用可能な統合ドメイン一般化フレームワークを提案する。
我々は、AmpAug(Amplitude Augmentation)法を用いて、低周波画像の変動を増大させ、学習能力を拡大する。
推論フェーズでは、システム内ドメインアライメント機構を導入し、ドメインの不一致を減らし、潜在的に排除する。
論文 参考訳(メタデータ) (2023-11-28T12:52:49Z) - Bridging the Gap: Heterogeneous Face Recognition with Conditional
Adaptive Instance Modulation [7.665392786787577]
本研究では,事前学習した顔認識ネットワークに統合可能な,新しい条件適応型インスタンス変調(CAIM)モジュールを提案する。
CAIMブロックは中間特徴写像を変調し、対象モダリティのスタイルに適応して領域ギャップを効果的にブリッジする。
提案手法は,最小限のペアサンプルでエンドツーエンドのトレーニングを可能にする。
論文 参考訳(メタデータ) (2023-07-13T19:17:04Z) - Prepended Domain Transformer: Heterogeneous Face Recognition without
Bells and Whistles [9.419177623349947]
我々は、異なる知覚モードで顔画像とマッチングする、驚くほどシンプルで、かつ、非常に効果的な方法を提案する。
提案するアプローチはアーキテクチャ非依存であり、事前訓練されたモデルに追加することができる。
ソースコードとプロトコルは一般公開される予定だ。
論文 参考訳(メタデータ) (2022-10-12T18:54:57Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Escaping Data Scarcity for High-Resolution Heterogeneous Face
Hallucination [68.78903256687697]
Heterogeneous Face Recognition (HFR) では、視覚や熱といった2つの異なる領域にまたがる顔のマッチングが目的である。
合成によるギャップを埋めようとする最近の手法は有望な結果を得たが、ペアトレーニングデータの不足により、その性能は依然として制限されている。
本稿では,HFRのための新しい顔幻覚パラダイムを提案する。これはデータ効率のよい合成を可能にするだけでなく,プライバシポリシーを破ることなくモデルトレーニングのスケールアップを可能にする。
論文 参考訳(メタデータ) (2022-03-30T20:44:33Z) - Heterogeneous Face Frontalization via Domain Agnostic Learning [74.86585699909459]
本研究では, 視覚領域における正面視を, ポーズのバリエーションで合成できるドメイン非依存学習型生成逆数ネットワーク(DAL-GAN)を提案する。
DAL-GANは、補助分類器を備えたジェネレータと、より優れた合成のために局所的およびグローバルなテクスチャ識別をキャプチャする2つの識別器から構成される。
論文 参考訳(メタデータ) (2021-07-17T20:41:41Z) - DotFAN: A Domain-transferred Face Augmentation Network for Pose and
Illumination Invariant Face Recognition [94.96686189033869]
本稿では,3次元モデルを用いたドメイン転送型顔強調ネットワーク(DotFAN)を提案する。
DotFANは、他のドメインから収集された既存のリッチフェイスデータセットから抽出された知識に基づいて、入力顔の一連の変種を生成することができる。
実験によると、DotFANは、クラス内の多様性を改善するために、小さな顔データセットを増やすのに有益である。
論文 参考訳(メタデータ) (2020-02-23T08:16:34Z) - Unsupervised Domain Adaptation in Person re-ID via k-Reciprocal
Clustering and Large-Scale Heterogeneous Environment Synthesis [76.46004354572956]
個人再識別のための教師なし領域適応手法を提案する。
実験結果から,ktCUDA法とSHRED法は,再同定性能において,+5.7 mAPの平均的改善を実現することがわかった。
論文 参考訳(メタデータ) (2020-01-14T17:43:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。