論文の概要: Bidirectional Multi-Step Domain Generalization for Visible-Infrared Person Re-Identification
- arxiv url: http://arxiv.org/abs/2403.10782v1
- Date: Sat, 16 Mar 2024 03:03:27 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-19 21:54:53.863129
- Title: Bidirectional Multi-Step Domain Generalization for Visible-Infrared Person Re-Identification
- Title(参考訳): 可視赤外人物再同定のための双方向多段階領域一般化
- Authors: Mahdi Alehdaghi, Pourya Shamsolmoali, Rafael M. O. Cruz, Eric Granger,
- Abstract要約: 可視赤外人物再識別(V-I ReID)における重要な課題は、モダリティ間の重要な相違を効果的に解決できるバックボーンモデルを訓練することである。
本稿では,多目的多段階領域一般化(Bidirectional Multi-step Domain Generalization)について紹介する。
挑戦的なV-I ReIDデータセットを用いて行った実験は、我々のBMDGアプローチがV-Iの人物ReIDから中間ドメインを生成する最先端のパーツベースモデルや手法より優れていることを示している。
- 参考スコア(独自算出の注目度): 12.14946364107671
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A key challenge in visible-infrared person re-identification (V-I ReID) is training a backbone model capable of effectively addressing the significant discrepancies across modalities. State-of-the-art methods that generate a single intermediate bridging domain are often less effective, as this generated domain may not adequately capture sufficient common discriminant information. This paper introduces the Bidirectional Multi-step Domain Generalization (BMDG), a novel approach for unifying feature representations across diverse modalities. BMDG creates multiple virtual intermediate domains by finding and aligning body part features extracted from both I and V modalities. Indeed, BMDG aims to reduce the modality gaps in two steps. First, it aligns modalities in feature space by learning shared and modality-invariant body part prototypes from V and I images. Then, it generalizes the feature representation by applying bidirectional multi-step learning, which progressively refines feature representations in each step and incorporates more prototypes from both modalities. In particular, our method minimizes the cross-modal gap by identifying and aligning shared prototypes that capture key discriminative features across modalities, then uses multiple bridging steps based on this information to enhance the feature representation. Experiments conducted on challenging V-I ReID datasets indicate that our BMDG approach outperforms state-of-the-art part-based models or methods that generate an intermediate domain from V-I person ReID.
- Abstract(参考訳): 可視赤外人物再識別(V-I ReID)における重要な課題は、モダリティ間の重要な相違に効果的に対処できるバックボーンモデルを訓練することである。
単一の中間ブリッジドメインを生成する最先端の手法は、この生成されたドメインが十分な共通識別情報を適切に取得できないため、効果が低いことが多い。
本稿では,双方向多段階領域一般化(BMDG)について紹介する。
BMDGは、IとVの両方のモダリティから抽出された身体部分の特徴を発見し、整列することで、複数の仮想中間ドメインを生成する。
実際、BMDGは2つのステップでモダリティギャップを減らすことを目指している。
第一に、VとIの画像から共有およびモダリティ不変の身体部分のプロトタイプを学習することにより、特徴空間におけるモダリティを整合させる。
そして、双方向多段階学習を適用して特徴表現を一般化し、各ステップにおける特徴表現を段階的に洗練し、両方のモダリティからより多くのプロトタイプを組み込む。
特に,本手法は,モダリティ間の重要な識別的特徴を捕捉する共有プロトタイプを識別・整合させることにより,モダリティ間のギャップを最小化し,その情報に基づいて複数のブリッジングステップを用いて特徴表現を強化する。
挑戦的なV-I ReIDデータセットを用いて行った実験は、我々のBMDGアプローチがV-Iの人物ReIDから中間ドメインを生成する最先端のパーツベースモデルや手法より優れていることを示している。
関連論文リスト
- Prototype-Driven Multi-Feature Generation for Visible-Infrared Person Re-identification [11.664820595258988]
可視的(視覚)画像と赤外線(赤外線)画像の違いから、可視的(赤外線)人物の再識別における主な課題が生じる。
既存の手法は、しばしば水平分割に頼って部分レベルの特徴を整列させ、不正確性を導入する。
クロスモーダルな相違を緩和することを目的としたPDM(Prototype-Driven Multi-Feature Generation framework)を提案する。
論文 参考訳(メタデータ) (2024-09-09T14:12:23Z) - HCVP: Leveraging Hierarchical Contrastive Visual Prompt for Domain
Generalization [69.33162366130887]
ドメイン一般化(DG)は、不変の機能を学ぶことによって、目に見えないシナリオに優れた機械学習モデルを作成するための取り組みである。
モデルにドメインレベルとタスク固有の特性を補足する新しい手法を提案する。
このアプローチは、特定の特徴から不変な特徴をより効果的に分離し、一般化を促進することを目的としている。
論文 参考訳(メタデータ) (2024-01-18T04:23:21Z) - Modality Unifying Network for Visible-Infrared Person Re-Identification [24.186989535051623]
Visible-infrared person re-identification (VI-ReID) は、異種間の大きな相違とクラス内変異のために難しい課題である。
既存の手法は主に、異なるモダリティを同じ特徴空間に埋め込むことで、モダリティ共有表現を学習することに焦点を当てている。
そこで我々は,VI-ReID の頑健な補助モダリティを探索するために,新しいモダリティ統一ネットワーク (MUN) を提案する。
論文 参考訳(メタデータ) (2023-09-12T14:22:22Z) - Adaptive Generation of Privileged Intermediate Information for
Visible-Infrared Person Re-Identification [11.93952924941977]
本稿では,Privileged Intermediate Information Trainingアプローチの適応生成について紹介する。
AGPI2は、VとIのモダリティ間で識別情報をブリッジする仮想ドメインを適応して生成するために導入された。
V-I ReIDを用いた実験の結果,AGPI2は余分な計算資源を使わずにマッチング精度を向上させることが示唆された。
論文 参考訳(メタデータ) (2023-07-06T18:08:36Z) - Causality-based Dual-Contrastive Learning Framework for Domain
Generalization [16.81075442901155]
ドメイン一般化(Domain Generalization, DG)は、本質的には分布外一般化のサブブランチである。
本稿では,機能およびプロトタイプのコントラストを考慮したDCL(Dual-Contrastive Learning)モジュールを提案する。
また、多様性シフトに関する情報を活用するために、類似性に基づくハードペアマイニング(SHM)戦略も導入する。
論文 参考訳(メタデータ) (2023-01-22T13:07:24Z) - Exploiting modality-invariant feature for robust multimodal emotion
recognition with missing modalities [76.08541852988536]
我々は、欠落したモダリティ・イマジネーション・ネットワーク(IF-MMIN)に不変な特徴を用いることを提案する。
提案モデルは,不確実なモダリティ条件下で,すべてのベースラインを上回り,全体の感情認識性能を不変に向上することを示す。
論文 参考訳(メタデータ) (2022-10-27T12:16:25Z) - A Novel Mix-normalization Method for Generalizable Multi-source Person
Re-identification [49.548815417844786]
人物再識別(Re-ID)は、監督されたシナリオにおいて大きな成功を収めた。
モデルがソースドメインに過度に適合するため、教師付きモデルを任意の未確認領域に直接転送することは困難である。
ドメイン・アウェア・ミックス正規化(DMN)とドメイン・ウェア・センター正規化(DCR)からなるMixNormを提案する。
論文 参考訳(メタデータ) (2022-01-24T18:09:38Z) - MSO: Multi-Feature Space Joint Optimization Network for RGB-Infrared
Person Re-Identification [35.97494894205023]
RGB-infrared cross-modality person re-identification (ReID) タスクは、可視モダリティと赤外線モダリティの同一性の画像を認識することを目的としている。
既存の手法は主に2ストリームアーキテクチャを使用して、最終的な共通特徴空間における2つのモード間の相違を取り除く。
単一モダリティ空間と共通空間の両方において、モダリティ調和可能な特徴を学習できる新しい多機能空間共同最適化(MSO)ネットワークを提案する。
論文 参考訳(メタデータ) (2021-10-21T16:45:23Z) - Learning Domain Invariant Representations for Generalizable Person
Re-Identification [71.35292121563491]
ReID(Generalizable person Re-Identification)は、最近のコンピュータビジョンコミュニティで注目を集めている。
DIR-ReID(Domain Invariant Representations for Generalizable Person Re-Identification)という新しい一般化フレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-29T18:59:48Z) - Multi-Domain Adversarial Feature Generalization for Person
Re-Identification [52.835955258959785]
マルチデータセット特徴一般化ネットワーク(MMFA-AAE)を提案する。
複数のラベル付きデータセットから普遍的なドメイン不変の特徴表現を学習し、それを見えないカメラシステムに一般化することができる。
また、最先端の教師付き手法や教師なしのドメイン適応手法を大きなマージンで超えている。
論文 参考訳(メタデータ) (2020-11-25T08:03:15Z) - Dual Distribution Alignment Network for Generalizable Person
Re-Identification [174.36157174951603]
ドメイン一般化(DG)は、人物再識別(Re-ID)を扱うための有望なソリューションとして機能する
本稿では、複数のソースドメインの分布を選択的に整列させることにより、この問題に対処するDual Distribution Alignment Network(DDAN)を提案する。
大規模なDomain Generalization Re-ID(DG Re-ID)ベンチマークでDDANを評価した。
論文 参考訳(メタデータ) (2020-07-27T00:08:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。