論文の概要: Cross-Modality Earth Mover's Distance for Visible Thermal Person
Re-Identification
- arxiv url: http://arxiv.org/abs/2203.01675v1
- Date: Thu, 3 Mar 2022 12:26:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-05 00:55:29.616158
- Title: Cross-Modality Earth Mover's Distance for Visible Thermal Person
Re-Identification
- Title(参考訳): 可視的熱的人物再同定のための地球モーバー距離
- Authors: Yongguo Ling, Zhun Zhong, Donglin Cao, Zhiming Luo, Yaojin Lin, Shaozi
Li, Nicu Sebe
- Abstract要約: Visible thermal person re-identification (VT-ReID) は、モダリティ間の相違と同一性内変異に悩まされる。
我々は,モーダルアライメント中の個人内変動の影響を軽減することができるクロスモーダルアースモーバー距離(CM-EMD)を提案する。
- 参考スコア(独自算出の注目度): 82.01051164653583
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Visible thermal person re-identification (VT-ReID) suffers from the
inter-modality discrepancy and intra-identity variations. Distribution
alignment is a popular solution for VT-ReID, which, however, is usually
restricted to the influence of the intra-identity variations. In this paper, we
propose the Cross-Modality Earth Mover's Distance (CM-EMD) that can alleviate
the impact of the intra-identity variations during modality alignment. CM-EMD
selects an optimal transport strategy and assigns high weights to pairs that
have a smaller intra-identity variation. In this manner, the model will focus
on reducing the inter-modality discrepancy while paying less attention to
intra-identity variations, leading to a more effective modality alignment.
Moreover, we introduce two techniques to improve the advantage of CM-EMD.
First, the Cross-Modality Discrimination Learning (CM-DL) is designed to
overcome the discrimination degradation problem caused by modality alignment.
By reducing the ratio between intra-identity and inter-identity variances,
CM-DL leads the model to learn more discriminative representations. Second, we
construct the Multi-Granularity Structure (MGS), enabling us to align
modalities from both coarse- and fine-grained levels with the proposed CM-EMD.
Extensive experiments show the benefits of the proposed CM-EMD and its
auxiliary techniques (CM-DL and MGS). Our method achieves state-of-the-art
performance on two VT-ReID benchmarks.
- Abstract(参考訳): Visible thermal person re-identification (VT-ReID) は、モダリティ間の相違とアイデンティティ内変異に悩まされる。
分布アライメントはvt-reidの一般的なソリューションであるが、通常、id内変異の影響に制限される。
本稿では,モーダリティアライメントにおける自己同一性内変動の影響を軽減するために,Cross-Modality Earth Mover's Distance (CM-EMD)を提案する。
CM-EMDは最適な輸送戦略を選択し、より小さなアイデンティティ内変動を持つペアに高い重みを割り当てる。
この方法では、モデルはモダリティ間の不一致を減らすことに集中し、アイデンティティ内変異に注意を払わないようにし、より効果的なモダリティアライメントへと繋がる。
さらに,CM-EMDの利点を改善するための2つの手法を提案する。
まず,モダリティアライメントによる識別劣化問題を克服するために,Cross-Modality Discrimination Learning (CM-DL) を設計した。
同一性内変異と同一性間分散の比を減少させることで、CM-DLはモデルにより識別的な表現を学習させる。
第2に,Multi-Granularity Structure (MGS)を構築し,粗度と微粒度の両方のモードをCM-EMDと整列させる。
大規模実験はCM-EMDとその補助技術(CM-DLとMGS)の利点を示している。
提案手法は2つのVT-ReIDベンチマークにおける最先端性能を実現する。
関連論文リスト
- Modality Unifying Network for Visible-Infrared Person Re-Identification [24.186989535051623]
Visible-infrared person re-identification (VI-ReID) は、異種間の大きな相違とクラス内変異のために難しい課題である。
既存の手法は主に、異なるモダリティを同じ特徴空間に埋め込むことで、モダリティ共有表現を学習することに焦点を当てている。
そこで我々は,VI-ReID の頑健な補助モダリティを探索するために,新しいモダリティ統一ネットワーク (MUN) を提案する。
論文 参考訳(メタデータ) (2023-09-12T14:22:22Z) - Cross-Attention is Not Enough: Incongruity-Aware Dynamic Hierarchical
Fusion for Multimodal Affect Recognition [69.32305810128994]
モダリティ間の同調性は、特に認知に影響を及ぼすマルチモーダル融合の課題となる。
本稿では,動的モダリティゲーティング(HCT-DMG)を用いた階層型クロスモーダルトランスを提案する。
HCT-DMG: 1) 従来のマルチモーダルモデルを約0.8Mパラメータで上回り、2) 不整合が認識に影響を及ぼすハードサンプルを認識し、3) 潜在レベルの非整合性をクロスモーダルアテンションで緩和する。
論文 参考訳(メタデータ) (2023-05-23T01:24:15Z) - Learning Progressive Modality-shared Transformers for Effective
Visible-Infrared Person Re-identification [27.75907274034702]
我々は,能率VI-ReIDのためのPMT(Progressive Modality-Shared Transformer)という新しいディープラーニングフレームワークを提案する。
モダリティギャップの負の効果を低減するために、まず、グレースケールの画像を補助的なモダリティとして捉え、進歩的な学習戦略を提案する。
クラス内差が大きく,クラス間差が少ない問題に対処するために,識別中心損失を提案する。
論文 参考訳(メタデータ) (2022-12-01T02:20:16Z) - Multi-Modal Mutual Information Maximization: A Novel Approach for
Unsupervised Deep Cross-Modal Hashing [73.29587731448345]
我々はCross-Modal Info-Max Hashing (CMIMH)と呼ばれる新しい手法を提案する。
モーダル内およびモーダル間の類似性を両立できる情報表現を学習する。
提案手法は、他の最先端のクロスモーダル検索手法よりも一貫して優れている。
論文 参考訳(メタデータ) (2021-12-13T08:58:03Z) - MSO: Multi-Feature Space Joint Optimization Network for RGB-Infrared
Person Re-Identification [35.97494894205023]
RGB-infrared cross-modality person re-identification (ReID) タスクは、可視モダリティと赤外線モダリティの同一性の画像を認識することを目的としている。
既存の手法は主に2ストリームアーキテクチャを使用して、最終的な共通特徴空間における2つのモード間の相違を取り除く。
単一モダリティ空間と共通空間の両方において、モダリティ調和可能な特徴を学習できる新しい多機能空間共同最適化(MSO)ネットワークを提案する。
論文 参考訳(メタデータ) (2021-10-21T16:45:23Z) - Cross-Modality Brain Tumor Segmentation via Bidirectional
Global-to-Local Unsupervised Domain Adaptation [61.01704175938995]
本論文では,UDAスキームに基づくBiGL(Bidirectional Global-to-Local)適応フレームワークを提案する。
具体的には、脳腫瘍をセグメント化するために、双方向画像合成およびセグメンテーションモジュールを提案する。
提案手法は, 最先端の非教師なし領域適応法を大きなマージンで上回っている。
論文 参考訳(メタデータ) (2021-05-17T10:11:45Z) - Margin Preserving Self-paced Contrastive Learning Towards Domain
Adaptation for Medical Image Segmentation [51.93711960601973]
クロスモーダル医療画像セグメンテーションのための自己ペースコントラスト学習モデルを保存する新しいマージンを提案する。
プログレッシブに洗練されたセマンティックプロトタイプの指導により、埋め込み表現空間の識別性を高めるために、コントラスト損失を減少させる新しいマージンが提案される。
クロスモーダル心セグメンテーションタスクの実験は、MPSCLが意味セグメンテーション性能を大幅に改善することを示した。
論文 参考訳(メタデータ) (2021-03-15T15:23:10Z) - Dual Gaussian-based Variational Subspace Disentanglement for
Visible-Infrared Person Re-Identification [19.481092102536827]
Visible-infrared person re-identification (VI-ReID)は、夜間のインテリジェント監視システムにおいて、困難かつ必須の課題である。
本稿では,2つのガウス型変分オートエンコーダ(DG-VAE)を提案する。
提案手法は2つのVI-ReIDデータセット上で最先端の手法より優れている。
論文 参考訳(メタデータ) (2020-08-06T08:43:35Z) - Dynamic Dual-Attentive Aggregation Learning for Visible-Infrared Person
Re-Identification [208.1227090864602]
Visible-infrared person re-identification (VI-ReID) は、歩行者検索の課題である。
既存のVI-ReID法は、識別可能性に制限があり、ノイズの多い画像に対して弱いロバスト性を持つグローバル表現を学習する傾向にある。
そこで我々は,VI-ReIDのための動的二段階集合(DDAG)学習法を提案する。
論文 参考訳(メタデータ) (2020-07-18T03:08:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。