論文の概要: Cross-Spectral Attention for Unsupervised RGB-IR Face Verification and Person Re-identification
- arxiv url: http://arxiv.org/abs/2411.19215v1
- Date: Thu, 28 Nov 2024 15:38:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-02 15:20:04.921824
- Title: Cross-Spectral Attention for Unsupervised RGB-IR Face Verification and Person Re-identification
- Title(参考訳): 教師なしRGB-IR顔認証と人物再識別のためのスペクトル横断的注意
- Authors: Kshitij Nikhal, Cedric Nimpa Fondje, Benjamin S. Riggan,
- Abstract要約: 可視光(RGB)や赤外線(IR)バンドからの顔や人の画像のマッチングなどの分光バイオメトリクスは、過去10年間で急速に進歩してきた。
本稿では,(1)新しい擬似三重項損失とクロススペクトル投票,(2)複数の部分空間を利用した新しいクロススペクトルアテンションネットワーク,(3)より識別性の高いクロススペクトルクラスタリングを実現するための構造化された空間性を提案する。
- 参考スコア(独自算出の注目度): 1.6768151308423365
- License:
- Abstract: Cross-spectral biometrics, such as matching imagery of faces or persons from visible (RGB) and infrared (IR) bands, have rapidly advanced over the last decade due to increasing sensitivity, size, quality, and ubiquity of IR focal plane arrays and enhanced analytics beyond the visible spectrum. Current techniques for mitigating large spectral disparities between RGB and IR imagery often include learning a discriminative common subspace by exploiting precisely curated data acquired from multiple spectra. Although there are challenges with determining robust architectures for extracting common information, a critical limitation for supervised methods is poor scalability in terms of acquiring labeled data. Therefore, we propose a novel unsupervised cross-spectral framework that combines (1) a new pseudo triplet loss with cross-spectral voting, (2) a new cross-spectral attention network leveraging multiple subspaces, and (3) structured sparsity to perform more discriminative cross-spectral clustering. We extensively compare our proposed RGB-IR biometric learning framework (and its individual components) with recent and previous state-of-the-art models on two challenging benchmark datasets: DEVCOM Army Research Laboratory Visible-Thermal Face Dataset (ARL-VTF) and RegDB person re-identification dataset, and, in some cases, achieve performance superior to completely supervised methods.
- Abstract(参考訳): 可視光(RGB)や赤外線(IR)バンドからの顔や人物の像のマッチングのような分光バイオメトリクスは、赤外線焦点平面アレイの感度、大きさ、品質、ユビキタス性の向上と、可視光線を超えた分析の強化により、過去10年間で急速に進歩している。
RGBとIR画像のスペクトル差を緩和する現在の技術は、しばしば、複数のスペクトルから取得した正確なキュレートされたデータを利用して、識別可能な共通部分空間を学習することを含む。
共通情報を抽出するためのロバストなアーキテクチャの決定には課題があるが、教師付き手法の限界はラベル付きデータの取得におけるスケーラビリティの低下である。
そこで本研究では,(1)新しい擬似三重項損失と,(2)複数の部分空間を利用した新しいクロススペクトルアテンションネットワーク,(3)より識別性の高いクロススペクトルクラスタリングを実現するための構造化された空間性を備えたクロススペクトルフレームワークを提案する。
我々は,提案したRGB-IRバイオメトリック学習フレームワーク(およびその個々のコンポーネント)と,DevCOM陸軍研究所 Visible-Thermal Face Dataset (ARL-VTF) とRegDB人体再識別データセットの2つの挑戦的ベンチマークデータセットに関する最新のおよび過去の最先端モデルとの比較を行った。
関連論文リスト
- Bringing RGB and IR Together: Hierarchical Multi-Modal Enhancement for Robust Transmission Line Detection [67.02804741856512]
高速かつ高精度なTL検出のために,RGBとIRデータを統合したHMMEN(Hierarchical Multi-Modal Enhancement Network)を提案する。
提案手法では,(1)階層的RGBおよびIR特徴写像を大まかに融合・拡張するMMEB,(2)デコーダ出力とIR特徴写像の不整合を変形可能な畳み込みを利用して補正するFAB,の2つの重要な構成要素を紹介する。
論文 参考訳(メタデータ) (2025-01-25T06:21:06Z) - Spectral Enhancement and Pseudo-Anchor Guidance for Infrared-Visible Person Re-Identification [8.054546048450414]
本稿では,SEPG-Net という名前の簡易かつ効果的なスペクトル拡張と擬似アンカー誘導ネットワークを提案する。
周波数領域情報とグレースケール空間に基づくより均一なスペクトル強調手法を提案する。
2つの公開ベンチマークデータセットの実験結果は、SEPG-Netの他の最先端手法よりも優れた性能を示している。
論文 参考訳(メタデータ) (2024-12-26T08:03:53Z) - Optimizing Multispectral Object Detection: A Bag of Tricks and Comprehensive Benchmarks [49.84182981950623]
RGBおよびTIR(熱赤外)変調を利用したマルチスペクトル物体検出は,課題として広く認識されている。
モダリティと堅牢な融合戦略の両方から特徴を効果的に抽出するだけでなく、スペクトルの相違といった問題に対処する能力も必要である。
本稿では,高パフォーマンス単一モードモデルのシームレスな最適化が可能な,効率的かつ容易にデプロイ可能なマルチスペクトルオブジェクト検出フレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-27T12:18:39Z) - Flare-Aware Cross-modal Enhancement Network for Multi-spectral Vehicle
Re-identification [29.48387524901101]
厳しい環境下では、RGBとNIRモダリティの非ネイティブな手がかりは、車両のランプや日光からの強いフレアによってしばしば失われる。
フレア崩壊したRGBとNIRの特徴をフレア免疫熱赤外スペクトルから誘導して適応的に復元するフレア・アウェア・クロスモーダル・エンハンスメント・ネットワークを提案する。
論文 参考訳(メタデータ) (2023-05-23T04:04:24Z) - Efficient Bilateral Cross-Modality Cluster Matching for Unsupervised Visible-Infrared Person ReID [56.573905143954015]
本稿では, クラスタ間マッチングによるモダリティギャップを低減するための, クラスタマッチングに基づく新たな学習フレームワークを提案する。
このような監視信号の下では、クラスタレベルで特徴を協調的に整列させるために、モダリティ・特定・モダリティ・非依存(MSMA)コントラスト学習フレームワークが提案されている。
公開SYSU-MM01とRegDBデータセットの実験により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2023-05-22T03:27:46Z) - Exploring Invariant Representation for Visible-Infrared Person
Re-Identification [77.06940947765406]
異なるスペクトルを横断する歩行者にアイデンティティを関連付けることを目的とした、クロススペクトルの人物再識別は、モダリティの相違の主な課題に直面している。
本稿では、ロバスト機能マイニングネットワーク(RFM)と呼ばれるエンドツーエンドのハイブリッド学習フレームワークにおいて、画像レベルと特徴レベルの両方の問題に対処する。
RegDBとSYSU-MM01という2つの標準的なクロススペクトル人物識別データセットの実験結果により,最先端の性能が示された。
論文 参考訳(メタデータ) (2023-02-02T05:24:50Z) - Target-aware Dual Adversarial Learning and a Multi-scenario
Multi-Modality Benchmark to Fuse Infrared and Visible for Object Detection [65.30079184700755]
本研究は、物体検出のために異なるように見える赤外線と可視画像の融合の問題に対処する。
従来のアプローチでは、2つのモダリティの根底にある共通点を発見し、反復最適化またはディープネットワークによって共通空間に融合する。
本稿では、融合と検出の連立問題に対する二段階最適化の定式化を提案し、その後、核融合と一般的に使用される検出ネットワークのためのターゲット認識デュアル逆学習(TarDAL)ネットワークに展開する。
論文 参考訳(メタデータ) (2022-03-30T11:44:56Z) - Hierarchical Deep CNN Feature Set-Based Representation Learning for
Robust Cross-Resolution Face Recognition [59.29808528182607]
クロスリゾリューション顔認識(CRFR)は、インテリジェントな監視およびバイオメトリックフォレンジックにおいて重要である。
既存の浅層学習と深層学習に基づく手法は、HR-LR対を共同特徴空間にマッピングすることに焦点を当てている。
本研究では,多レベル深層畳み込みニューラルネットワーク(CNN)の機能を完全に活用し,堅牢なCRFRを実現することを目的とする。
論文 参考訳(メタデータ) (2021-03-25T14:03:42Z) - There and Back Again: Self-supervised Multispectral Correspondence
Estimation [13.56924750612194]
自己監督が可能な新しいサイクル一貫性指標を紹介します。
これにより、スペクトルに依存しない損失関数と組み合わせることで、同じネットワークを複数のスペクトルにわたってトレーニングできます。
本研究では,高密度RGB-FIR対応推定の課題に対するアプローチを示す。
論文 参考訳(メタデータ) (2021-03-19T12:33:56Z) - SFANet: A Spectrum-aware Feature Augmentation Network for
Visible-Infrared Person Re-Identification [12.566284647658053]
クロスモダリティマッチング問題に対するSFANetという新しいスペクトル認識特徴量化ネットワークを提案する。
grayscale-spectrumイメージで学習すると、モダリティの不一致を低減し、内部構造関係を検出することができる。
特徴レベルでは、特定および粉砕可能な畳み込みブロックの数のバランスをとることにより、従来の2ストリームネットワークを改善します。
論文 参考訳(メタデータ) (2021-02-24T08:57:32Z) - Cross-Spectrum Dual-Subspace Pairing for RGB-infrared Cross-Modality
Person Re-Identification [15.475897856494583]
従来の人物識別はRGBカラー画像しか扱えないが、暗い条件下では失敗する。
RGB赤外線ReID(Infrared-Visible ReID、Visible-Thermal ReIDとも呼ばれる)が提案されている。
本稿では, 新たなマルチスペクトル画像生成手法を提案し, 生成したサンプルを用いて, ネットワークの識別情報検索を支援する。
論文 参考訳(メタデータ) (2020-02-29T09:01:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。