論文の概要: Multi-Domain Biometric Recognition using Body Embeddings
- arxiv url: http://arxiv.org/abs/2503.10931v1
- Date: Thu, 13 Mar 2025 22:38:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-17 13:07:37.198784
- Title: Multi-Domain Biometric Recognition using Body Embeddings
- Title(参考訳): 生体内埋め込みを用いたマルチドメインバイオメトリック認識
- Authors: Anirudh Nanduri, Siyuan Huang, Rama Chellappa,
- Abstract要約: 身体埋め込みは中波長赤外線(MWIR)領域と長波長赤外線(LWIR)領域の顔埋め込みよりも優れていた。
我々は、IJB-MDFデータセット上でのベンチマーク結果を確立するために、ビジョントランスフォーマーアーキテクチャを活用している。
また, クロスエントロピーとトリプルト損失の単純な組み合わせで, VISデータにのみ事前訓練された体モデルを微調整することで, 最先端のmAPスコアが得られることを示す。
- 参考スコア(独自算出の注目度): 51.36007967653781
- License:
- Abstract: Biometric recognition becomes increasingly challenging as we move away from the visible spectrum to infrared imagery, where domain discrepancies significantly impact identification performance. In this paper, we show that body embeddings perform better than face embeddings for cross-spectral person identification in medium-wave infrared (MWIR) and long-wave infrared (LWIR) domains. Due to the lack of multi-domain datasets, previous research on cross-spectral body identification - also known as Visible-Infrared Person Re-Identification (VI-ReID) - has primarily focused on individual infrared bands, such as near-infrared (NIR) or LWIR, separately. We address the multi-domain body recognition problem using the IARPA Janus Benchmark Multi-Domain Face (IJB-MDF) dataset, which enables matching of short-wave infrared (SWIR), MWIR, and LWIR images against RGB (VIS) images. We leverage a vision transformer architecture to establish benchmark results on the IJB-MDF dataset and, through extensive experiments, provide valuable insights into the interrelation of infrared domains, the adaptability of VIS-pretrained models, the role of local semantic features in body-embeddings, and effective training strategies for small datasets. Additionally, we show that finetuning a body model, pretrained exclusively on VIS data, with a simple combination of cross-entropy and triplet losses achieves state-of-the-art mAP scores on the LLCM dataset.
- Abstract(参考訳): 生体認証は、可視スペクトルから赤外線画像へと移行するにつれ、ますます困難になってきている。
本稿では,中波長赤外線(MWIR)領域と長波長赤外線(LWIR)領域におけるクロススペクトル人物識別のための顔埋め込みよりも身体埋め込みが優れていることを示す。
マルチドメインデータセットの欠如により、従来は可視赤外人物再識別(VI-ReID)とも呼ばれていたクロススペクトル体同定の研究は、主に近赤外線(NIR)やLWIR(LWIR)といった個々の赤外線バンドに焦点を当てていた。
IARPA Janus Benchmark Multi-Domain Face (IJB-MDF)データセットを用いて、短波長赤外線(SWIR)、MWIR、LWIR画像とRGB(VIS)画像とのマッチングを可能にする多領域体認識問題に対処する。
我々は、IJB-MDFデータセットのベンチマーク結果を確立するために、視覚トランスフォーマーアーキテクチャを活用し、広範囲な実験を通じて、赤外線領域の相互関係、VIS事前学習モデルの適応性、身体埋め込みにおける局所的な意味的特徴の役割、小さなデータセットに対する効果的なトレーニング戦略に関する貴重な洞察を提供する。
さらに,直交エントロピーと三重項損失の単純な組み合わせで,VISデータにのみ事前訓練された身体モデルを微調整することで,LLCMデータセットの最先端のmAPスコアが得られることを示す。
関連論文リスト
- Cross-Spectral Attention for Unsupervised RGB-IR Face Verification and Person Re-identification [1.6768151308423365]
可視光(RGB)や赤外線(IR)バンドからの顔や人の画像のマッチングなどの分光バイオメトリクスは、過去10年間で急速に進歩してきた。
本稿では,(1)新しい擬似三重項損失とクロススペクトル投票,(2)複数の部分空間を利用した新しいクロススペクトルアテンションネットワーク,(3)より識別性の高いクロススペクトルクラスタリングを実現するための構造化された空間性を提案する。
論文 参考訳(メタデータ) (2024-11-28T15:38:15Z) - Frequency Domain Nuances Mining for Visible-Infrared Person
Re-identification [75.87443138635432]
既存の手法は主に、識別周波数情報を無視しながら空間情報を利用する。
本稿では,周波数領域情報を対象とした周波数領域Nuances Mining(FDNM)手法を提案する。
本手法は,SYSU-MM01データセットにおいて,Ran-1精度が5.2%,mAPが5.8%向上する。
論文 参考訳(メタデータ) (2024-01-04T09:19:54Z) - Diverse Embedding Expansion Network and Low-Light Cross-Modality
Benchmark for Visible-Infrared Person Re-identification [26.71900654115498]
多様な埋め込み拡張ネットワーク(DEEN)と呼ばれる,埋め込み空間における新たな拡張ネットワークを提案する。
提案したDEENは,多種多様な埋め込みを効果的に生成し,情報的特徴表現を学習する。
9RGB/IRカメラでキャプチャされた1,064個の識別された46,767個のバウンディングボックスを含む低照度クロスモダリティ(LLCM)データセットを提供する。
論文 参考訳(メタデータ) (2023-03-25T14:24:56Z) - Exploring Invariant Representation for Visible-Infrared Person
Re-Identification [77.06940947765406]
異なるスペクトルを横断する歩行者にアイデンティティを関連付けることを目的とした、クロススペクトルの人物再識別は、モダリティの相違の主な課題に直面している。
本稿では、ロバスト機能マイニングネットワーク(RFM)と呼ばれるエンドツーエンドのハイブリッド学習フレームワークにおいて、画像レベルと特徴レベルの両方の問題に対処する。
RegDBとSYSU-MM01という2つの標準的なクロススペクトル人物識別データセットの実験結果により,最先端の性能が示された。
論文 参考訳(メタデータ) (2023-02-02T05:24:50Z) - Physically-Based Face Rendering for NIR-VIS Face Recognition [165.54414962403555]
近赤外(NIR)と可視(VIS)の顔マッチングは、大きなドメインギャップのために困難である。
NIR-VIS対顔画像生成のための新しい手法を提案する。
アイデンティティ特徴学習を容易にするために,IDentityに基づく最大平均離散性(ID-MMD)損失を提案する。
論文 参考訳(メタデータ) (2022-11-11T18:48:16Z) - Visible-Infrared Person Re-Identification Using Privileged Intermediate
Information [10.816003787786766]
クロスモーダルな人物再識別(ReID)は、RGBとIRモダリティ間のデータ分散の大きなドメインシフトのために困難である。
本稿では2つのメインドメイン間のブリッジとして機能する中間仮想ドメインを作成するための新しいアプローチを提案する。
我々は、深いReIDモデルをトレーニングするための追加情報を提供する、可視領域と赤外線領域間の画像を生成する新しい手法を考案した。
論文 参考訳(メタデータ) (2022-09-19T21:08:14Z) - Robust Environment Perception for Automated Driving: A Unified Learning
Pipeline for Visual-Infrared Object Detection [2.478658210785]
我々は、頑健な物体検出のために、視覚と熱の両方の知覚ユニットを利用する。
本稿では,物体検出のために,視覚と熱の両方の知覚ユニットを利用する。
論文 参考訳(メタデータ) (2022-06-08T15:02:58Z) - Unsupervised Misaligned Infrared and Visible Image Fusion via
Cross-Modality Image Generation and Registration [59.02821429555375]
我々は、教師なし不整合赤外線と可視画像融合のための頑健な相互モダリティ生成登録パラダイムを提案する。
登録された赤外線画像と可視画像とを融合させるため,IFM (Feature Interaction Fusion Module) を提案する。
論文 参考訳(メタデータ) (2022-05-24T07:51:57Z) - Infrared Small-Dim Target Detection with Transformer under Complex
Backgrounds [155.388487263872]
変換器を用いた赤外線小径目標検出手法を提案する。
画像特徴の相互作用情報をより広い範囲で学習するために,変換器の自己認識機構を採用する。
最小限のターゲットの機能を学習するための機能拡張モジュールも設計しています。
論文 参考訳(メタデータ) (2021-09-29T12:23:41Z) - Cross-Spectral Iris Matching Using Conditional Coupled GAN [22.615156512223766]
クロススペクトル虹彩認識は、個人のアイデンティティを認証するための有望な生体計測手法として出現している。
異なるスペクトル帯域で取得したアイリス画像のマッチングは、単一帯域近赤外(NIR)マッチングと比較して顕著な性能低下を示した。
クロススペクトル虹彩認識のための条件結合生成対向ネットワーク(CpGAN)アーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-10-09T19:13:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。