論文の概要: From Modalities to Styles: Rethinking the Domain Gap in Heterogeneous Face Recognition
- arxiv url: http://arxiv.org/abs/2404.14247v1
- Date: Mon, 22 Apr 2024 15:00:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-23 13:37:25.086420
- Title: From Modalities to Styles: Rethinking the Domain Gap in Heterogeneous Face Recognition
- Title(参考訳): モダリティからスタイルへ:不均一顔認識における領域ギャップの再考
- Authors: Anjith George, Sebastien Marcel,
- Abstract要約: 本研究では,既存の顔認識ネットワークにシームレスに適合する条件適応型インスタンス変調(CAIM)モジュールを提案する。
CAIMブロックは中間特徴写像を変調し、ソースモダリティのスタイルに効率よく適応し、ドメインギャップをブリッジする。
我々は,提案手法を様々な挑戦的HFRベンチマークで広く評価し,最先端の手法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 4.910937238451485
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Heterogeneous Face Recognition (HFR) focuses on matching faces from different domains, for instance, thermal to visible images, making Face Recognition (FR) systems more versatile for challenging scenarios. However, the domain gap between these domains and the limited large-scale datasets in the target HFR modalities make it challenging to develop robust HFR models from scratch. In our work, we view different modalities as distinct styles and propose a method to modulate feature maps of the target modality to address the domain gap. We present a new Conditional Adaptive Instance Modulation (CAIM ) module that seamlessly fits into existing FR networks, turning them into HFR-ready systems. The CAIM block modulates intermediate feature maps, efficiently adapting to the style of the source modality and bridging the domain gap. Our method enables end-to-end training using a small set of paired samples. We extensively evaluate the proposed approach on various challenging HFR benchmarks, showing that it outperforms state-of-the-art methods. The source code and protocols for reproducing the findings will be made publicly available
- Abstract(参考訳): Heterogeneous Face Recognition (HFR)は、例えば熱画像から可視画像まで、さまざまな領域の顔のマッチングに焦点を当てており、顔認識(FR)システムは困難なシナリオに対してより汎用的である。
しかし、これらのドメインとターゲットHFRモダリティの限られた大規模データセットとのドメインギャップは、スクラッチから堅牢なHFRモデルを開発するのを困難にしている。
本研究では,異なるモダリティを異なるスタイルとみなし,対象のモダリティの特徴マップをドメインギャップに対処する手法を提案する。
本稿では、既存のFRネットワークにシームレスに適合し、それらをHFR対応システムに変換する、新しい条件適応インスタンス変調(CAIM)モジュールを提案する。
CAIMブロックは中間特徴写像を変調し、ソースモダリティのスタイルに効率よく適応し、ドメインギャップをブリッジする。
提案手法は,少数のペアサンプルを用いてエンドツーエンドのトレーニングを可能にする。
我々は,提案手法を様々な挑戦的HFRベンチマークで広く評価し,最先端の手法よりも優れていることを示す。
発見を再現するソースコードとプロトコルを公開する。
関連論文リスト
- Modality Agnostic Heterogeneous Face Recognition with Switch Style Modulators [4.910937238451485]
推論中に複数のモーダルを扱えるモーダリティ非依存HFR法を訓練するための新しいフレームワークを提案する。
Switch Style Modulation Blocks (SSMB) と呼ばれる,計算効率のよい自動ルーティング機構を実装することで実現した。
提案したSSMBは、エンドツーエンドにトレーニングでき、事前訓練された顔認識モデルにシームレスに統合され、モダリティに依存しないHFRモデルに変換される。
論文 参考訳(メタデータ) (2024-07-11T16:21:48Z) - Heterogeneous Face Recognition Using Domain Invariant Units [4.910937238451485]
教師ネットワークとして事前訓練された顔認識モデルを用いてドメイン不変ネットワーク層(DIU)を学習する。
提案したDIUは、対照的な蒸留フレームワークを用いて、限られた量のペアトレーニングデータでも効果的に訓練することができる。
提案手法は、事前訓練されたモデルを強化する可能性があり、より広い範囲のデータに適応できる。
論文 参考訳(メタデータ) (2024-04-22T16:58:37Z) - DARNet: Bridging Domain Gaps in Cross-Domain Few-Shot Segmentation with
Dynamic Adaptation [20.979759016826378]
Few-shot segmentation (FSS) は、ベースクラスからの少数のサポートイメージを使用することで、新しいクラスをクエリイメージにセグメントすることを目的としている。
クロスドメイン FSS では、リソース制約のあるドメインにラベルに富んだドメインの機能を活用することで、ドメインの相違による課題が生じる。
本研究は,CD-FSSの一般化と特異性を両立するDARNet法を提案する。
論文 参考訳(メタデータ) (2023-12-08T03:03:22Z) - Rethinking the Domain Gap in Near-infrared Face Recognition [65.7871950460781]
不均一顔認識(HFR)は、視覚領域(VIS)と近赤外領域(NIR)にまたがる複雑な顔画像マッチング作業を伴う。
HFRに関する既存の文献の多くは、ドメインギャップを主要な課題と認識し、それを入力レベルまたは機能レベルでブリッジする取り組みを指示している。
大規模同質なVISデータで事前トレーニングを行った場合、大規模ニューラルネットワークはより小さなニューラルネットワークとは異なり、HFRでは例外的なゼロショット性能を示す。
論文 参考訳(メタデータ) (2023-12-01T14:43:28Z) - Bridging the Gap: Heterogeneous Face Recognition with Conditional
Adaptive Instance Modulation [7.665392786787577]
本研究では,事前学習した顔認識ネットワークに統合可能な,新しい条件適応型インスタンス変調(CAIM)モジュールを提案する。
CAIMブロックは中間特徴写像を変調し、対象モダリティのスタイルに適応して領域ギャップを効果的にブリッジする。
提案手法は,最小限のペアサンプルでエンドツーエンドのトレーニングを可能にする。
論文 参考訳(メタデータ) (2023-07-13T19:17:04Z) - Prepended Domain Transformer: Heterogeneous Face Recognition without
Bells and Whistles [9.419177623349947]
我々は、異なる知覚モードで顔画像とマッチングする、驚くほどシンプルで、かつ、非常に効果的な方法を提案する。
提案するアプローチはアーキテクチャ非依存であり、事前訓練されたモデルに追加することができる。
ソースコードとプロトコルは一般公開される予定だ。
論文 参考訳(メタデータ) (2022-10-12T18:54:57Z) - Deep face recognition with clustering based domain adaptation [57.29464116557734]
そこで本研究では,ターゲットドメインとソースがクラスを共有しない顔認識タスクを対象とした,クラスタリングに基づく新しいドメイン適応手法を提案する。
本手法は,特徴領域をグローバルに整列させ,その一方で,対象クラスタを局所的に識別することで,識別対象特徴を効果的に学習する。
論文 参考訳(メタデータ) (2022-05-27T12:29:11Z) - Inter-class Discrepancy Alignment for Face Recognition [55.578063356210144]
IA(Inter-class DiscrepancyAlignment)という統合フレームワークを提案する。
IDA-DAOは、画像と隣人の相違を考慮した類似度スコアの整合に使用される。
IDA-SSEは、GANで生成された仮想候補画像を導入することで、説得力のあるクラス間隣人を提供できます。
論文 参考訳(メタデータ) (2021-03-02T08:20:08Z) - Domain Conditioned Adaptation Network [90.63261870610211]
本稿では,ドメイン条件付きチャネルアテンション機構を用いて,異なる畳み込みチャネルを励起するドメイン条件適応ネットワーク(DCAN)を提案する。
これは、ディープDAネットワークのドメインワイドな畳み込みチャネルアクティベーションを探求する最初の試みである。
論文 参考訳(メタデータ) (2020-05-14T04:23:24Z) - Learning Meta Face Recognition in Unseen Domains [74.69681594452125]
メタ顔認識(MFR)というメタラーニングを用いた新しい顔認識手法を提案する。
MFRは、メタ最適化目標を用いてソース/ターゲットドメインシフトを合成する。
一般化顔認識評価のためのベンチマークを2つ提案する。
論文 参考訳(メタデータ) (2020-03-17T14:10:30Z) - Unsupervised Domain Adaptation in Person re-ID via k-Reciprocal
Clustering and Large-Scale Heterogeneous Environment Synthesis [76.46004354572956]
個人再識別のための教師なし領域適応手法を提案する。
実験結果から,ktCUDA法とSHRED法は,再同定性能において,+5.7 mAPの平均的改善を実現することがわかった。
論文 参考訳(メタデータ) (2020-01-14T17:43:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。