論文の概要: Dual Gaussian-based Variational Subspace Disentanglement for
Visible-Infrared Person Re-Identification
- arxiv url: http://arxiv.org/abs/2008.02520v1
- Date: Thu, 6 Aug 2020 08:43:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 07:21:23.367444
- Title: Dual Gaussian-based Variational Subspace Disentanglement for
Visible-Infrared Person Re-Identification
- Title(参考訳): 可視赤外人物再同定のための二重ガウスに基づく変分部分空間のアンタングル
- Authors: Nan Pu, Wei Chen, Yu Liu, Erwin M. Bakker, Michael S. Lew
- Abstract要約: Visible-infrared person re-identification (VI-ReID)は、夜間のインテリジェント監視システムにおいて、困難かつ必須の課題である。
本稿では,2つのガウス型変分オートエンコーダ(DG-VAE)を提案する。
提案手法は2つのVI-ReIDデータセット上で最先端の手法より優れている。
- 参考スコア(独自算出の注目度): 19.481092102536827
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visible-infrared person re-identification (VI-ReID) is a challenging and
essential task in night-time intelligent surveillance systems. Except for the
intra-modality variance that RGB-RGB person re-identification mainly overcomes,
VI-ReID suffers from additional inter-modality variance caused by the inherent
heterogeneous gap. To solve the problem, we present a carefully designed dual
Gaussian-based variational auto-encoder (DG-VAE), which disentangles an
identity-discriminable and an identity-ambiguous cross-modality feature
subspace, following a mixture-of-Gaussians (MoG) prior and a standard Gaussian
distribution prior, respectively. Disentangling cross-modality
identity-discriminable features leads to more robust retrieval for VI-ReID. To
achieve efficient optimization like conventional VAE, we theoretically derive
two variational inference terms for the MoG prior under the supervised setting,
which not only restricts the identity-discriminable subspace so that the model
explicitly handles the cross-modality intra-identity variance, but also enables
the MoG distribution to avoid posterior collapse. Furthermore, we propose a
triplet swap reconstruction (TSR) strategy to promote the above disentangling
process. Extensive experiments demonstrate that our method outperforms
state-of-the-art methods on two VI-ReID datasets.
- Abstract(参考訳): Visible-infrared person re-identification (VI-ReID) は、夜間のインテリジェント監視システムにおいて、困難かつ必須の課題である。
RGB-RGBの人物の再識別が主に克服するモダリティ内分散を除いて、VI-ReIDは固有の異種ギャップに起因するモダリティ間分散に苦しむ。
そこで本稿では,二元ガウシアン系変分オートエンコーダ(dg-vae)について,先行する混合ガウシアン (mog) と標準ガウシアン分布 (標準ガウシアン分布) に準じて,同一性判別可能部分空間と同一性あいまいなクロスモダリティ特徴部分空間とを分離した,注意深く設計された二元ガウシアン系変分オートエンコーダ(dg-vae)を提案する。
VI-ReIDのより堅牢な検索に繋がる。
従来のVAEのような効率的な最適化を実現するために,教師付き設定下でのMoGの2つの変分推論項を理論的に導出する。
さらに,このプロセスを促進するために,トリプルトスワップ再構築(TSR)戦略を提案する。
2つのVI-ReIDデータセットにおいて,本手法が最先端の手法より優れていることを示す。
関連論文リスト
- Unsupervised Visible-Infrared ReID via Pseudo-label Correction and Modality-level Alignment [23.310509459311046]
UVI-ReID (unsupervised visible-infrared person re-identification) が近年注目されている。
従来手法では, UVI-ReIDを実現するためにモダリティ内クラスタリングとクロスモダリティ特徴マッチングが用いられていた。
論文 参考訳(メタデータ) (2024-04-10T02:03:14Z) - Cross-Modality Perturbation Synergy Attack for Person Re-identification [66.48494594909123]
相互モダリティReIDの主な課題は、異なるモダリティ間の視覚的差異を効果的に扱うことである。
既存の攻撃方法は、目に見える画像のモダリティの特徴に主に焦点を当てている。
本研究では,クロスモーダルReIDに特化して設計されたユニバーサル摂動攻撃を提案する。
論文 参考訳(メタデータ) (2024-01-18T15:56:23Z) - Modality Unifying Network for Visible-Infrared Person Re-Identification [24.186989535051623]
Visible-infrared person re-identification (VI-ReID) は、異種間の大きな相違とクラス内変異のために難しい課題である。
既存の手法は主に、異なるモダリティを同じ特徴空間に埋め込むことで、モダリティ共有表現を学習することに焦点を当てている。
そこで我々は,VI-ReID の頑健な補助モダリティを探索するために,新しいモダリティ統一ネットワーク (MUN) を提案する。
論文 参考訳(メタデータ) (2023-09-12T14:22:22Z) - Exploring Invariant Representation for Visible-Infrared Person
Re-Identification [77.06940947765406]
異なるスペクトルを横断する歩行者にアイデンティティを関連付けることを目的とした、クロススペクトルの人物再識別は、モダリティの相違の主な課題に直面している。
本稿では、ロバスト機能マイニングネットワーク(RFM)と呼ばれるエンドツーエンドのハイブリッド学習フレームワークにおいて、画像レベルと特徴レベルの両方の問題に対処する。
RegDBとSYSU-MM01という2つの標準的なクロススペクトル人物識別データセットの実験結果により,最先端の性能が示された。
論文 参考訳(メタデータ) (2023-02-02T05:24:50Z) - Modality-Adaptive Mixup and Invariant Decomposition for RGB-Infrared
Person Re-Identification [84.32086702849338]
RGB-赤外線人物再同定のための新しいモダリティ適応混合・不変分解(MID)手法を提案する。
MIDは、RGBと赤外線画像の混合画像を生成するためのモダリティ適応混合方式を設計する。
2つの挑戦的なベンチマーク実験は、最先端の手法よりもMIDの優れた性能を示す。
論文 参考訳(メタデータ) (2022-03-03T14:26:49Z) - Cross-Modality Earth Mover's Distance for Visible Thermal Person
Re-Identification [82.01051164653583]
Visible thermal person re-identification (VT-ReID) は、モダリティ間の相違と同一性内変異に悩まされる。
我々は,モーダルアライメント中の個人内変動の影響を軽減することができるクロスモーダルアースモーバー距離(CM-EMD)を提案する。
論文 参考訳(メタデータ) (2022-03-03T12:26:59Z) - MSO: Multi-Feature Space Joint Optimization Network for RGB-Infrared
Person Re-Identification [35.97494894205023]
RGB-infrared cross-modality person re-identification (ReID) タスクは、可視モダリティと赤外線モダリティの同一性の画像を認識することを目的としている。
既存の手法は主に2ストリームアーキテクチャを使用して、最終的な共通特徴空間における2つのモード間の相違を取り除く。
単一モダリティ空間と共通空間の両方において、モダリティ調和可能な特徴を学習できる新しい多機能空間共同最適化(MSO)ネットワークを提案する。
論文 参考訳(メタデータ) (2021-10-21T16:45:23Z) - Multi-Scale Cascading Network with Compact Feature Learning for
RGB-Infrared Person Re-Identification [35.55895776505113]
マルチスケールパートアウェアカスケードフレームワーク(MSPAC)は、マルチスケールの細かい機能を部分からグローバルに集約することによって策定されます。
したがって、クロスモダリティ相関は、特徴的モダリティ不変な特徴学習のための顕著な特徴を効率的に探索することができる。
論文 参考訳(メタデータ) (2020-12-12T15:39:11Z) - DVG-Face: Dual Variational Generation for Heterogeneous Face Recognition [85.94331736287765]
我々は、HFRを二重生成問題として定式化し、新しいDual Variational Generation(DVG-Face)フレームワークを用いてそれに取り組む。
大規模可視データの豊富なアイデンティティ情報を結合分布に統合する。
同一の同一性を持つ多種多様な多種多様な画像は、ノイズから生成することができる。
論文 参考訳(メタデータ) (2020-09-20T09:48:24Z) - Dynamic Dual-Attentive Aggregation Learning for Visible-Infrared Person
Re-Identification [208.1227090864602]
Visible-infrared person re-identification (VI-ReID) は、歩行者検索の課題である。
既存のVI-ReID法は、識別可能性に制限があり、ノイズの多い画像に対して弱いロバスト性を持つグローバル表現を学習する傾向にある。
そこで我々は,VI-ReIDのための動的二段階集合(DDAG)学習法を提案する。
論文 参考訳(メタデータ) (2020-07-18T03:08:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。