論文の概要: Multi-Scale Cascading Network with Compact Feature Learning for
RGB-Infrared Person Re-Identification
- arxiv url: http://arxiv.org/abs/2012.06843v1
- Date: Sat, 12 Dec 2020 15:39:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-10 05:16:46.141598
- Title: Multi-Scale Cascading Network with Compact Feature Learning for
RGB-Infrared Person Re-Identification
- Title(参考訳): rgb-infrared person re-identificationのためのコンパクト特徴学習を用いたマルチスケールカスケードネットワーク
- Authors: Can Zhang, Hong Liu, Wei Guo, Mang Ye
- Abstract要約: マルチスケールパートアウェアカスケードフレームワーク(MSPAC)は、マルチスケールの細かい機能を部分からグローバルに集約することによって策定されます。
したがって、クロスモダリティ相関は、特徴的モダリティ不変な特徴学習のための顕著な特徴を効率的に探索することができる。
- 参考スコア(独自算出の注目度): 35.55895776505113
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: RGB-Infrared person re-identification (RGB-IR Re-ID) aims to match persons
from heterogeneous images captured by visible and thermal cameras, which is of
great significance in the surveillance system under poor light conditions.
Facing great challenges in complex variances including conventional
single-modality and additional inter-modality discrepancies, most of the
existing RGB-IR Re-ID methods propose to impose constraints in image level,
feature level or a hybrid of both. Despite the better performance of hybrid
constraints, they are usually implemented with heavy network architecture. As a
matter of fact, previous efforts contribute more as pioneering works in new
cross-modal Re-ID area while leaving large space for improvement. This can be
mainly attributed to: (1) lack of abundant person image pairs from different
modalities for training, and (2) scarcity of salient modality-invariant
features especially on coarse representations for effective matching. To
address these issues, a novel Multi-Scale Part-Aware Cascading framework
(MSPAC) is formulated by aggregating multi-scale fine-grained features from
part to global in a cascading manner, which results in a unified representation
containing rich and enhanced semantic features. Furthermore, a marginal
exponential centre (MeCen) loss is introduced to jointly eliminate mixed
variances from intra- and inter-modal examples. Cross-modality correlations can
thus be efficiently explored on salient features for distinctive
modality-invariant feature learning. Extensive experiments are conducted to
demonstrate that the proposed method outperforms all the state-of-the-art by a
large margin.
- Abstract(参考訳): rgb-infrared person re-id(rgb-ir re-id)は、可視・熱カメラで撮影された異種画像から人物をマッチングすることを目的としている。
従来の単一モダリティや追加のモダリティ間不一致を含む複雑な分散において大きな課題に直面した既存のrgb-ir re-id法の多くは、画像レベル、特徴レベル、または両方のハイブリッドに制約を課すことを提案している。
ハイブリッド制約の優れたパフォーマンスにもかかわらず、それらは通常、重いネットワークアーキテクチャで実装される。
実際、以前の取り組みは、新しいクロスモーダルre-id領域における先駆的な作業として貢献し、改善のための大きなスペースを残している。
主な要因は,(1)訓練のための異なるモダリティから豊富な人物画像ペアが欠如していること,(2) 健全なモダリティ不変の特徴の欠如,(2) 効果的なマッチングのための粗い表現の欠如である。
これらの問題に対処するために,マルチスケールの細粒度の機能をカスケード方式で集約し,リッチで拡張されたセマンティクス機能を含む統一表現を実現することにより,新たなマルチスケール部分認識型カスケードフレームワーク(mspac)を策定する。
さらに、マージン指数中心(mecen)損失を導入し、モーダル内およびモーダル間例から混合分散を除去する。
したがって、相互モダリティ相関は、特徴的モダリティ不変特徴学習のためのサルエント特徴について効率的に研究することができる。
提案手法が最先端のすべての技術を大きなマージンで上回ることを示すために,広範な実験を行った。
関連論文リスト
- Cross-Modality Perturbation Synergy Attack for Person Re-identification [66.48494594909123]
相互モダリティReIDの主な課題は、異なるモダリティ間の視覚的差異を効果的に扱うことである。
既存の攻撃方法は、目に見える画像のモダリティの特徴に主に焦点を当てている。
本研究では,クロスモーダルReIDに特化して設計されたユニバーサル摂動攻撃を提案する。
論文 参考訳(メタデータ) (2024-01-18T15:56:23Z) - Efficient Bilateral Cross-Modality Cluster Matching for Unsupervised Visible-Infrared Person ReID [56.573905143954015]
本稿では, クラスタ間マッチングによるモダリティギャップを低減するための, クラスタマッチングに基づく新たな学習フレームワークを提案する。
このような監視信号の下では、クラスタレベルで特徴を協調的に整列させるために、モダリティ・特定・モダリティ・非依存(MSMA)コントラスト学習フレームワークが提案されている。
公開SYSU-MM01とRegDBデータセットの実験により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2023-05-22T03:27:46Z) - A Multi-modal Approach to Single-modal Visual Place Classification [2.580765958706854]
RGBと深度(D)を組み合わせたマルチセンサー融合アプローチが近年人気を集めている。
単一モードRGB画像分類タスクを擬似多モードRGB-D分類問題として再構成する。
これら2つのモダリティを適切に処理し、融合し、分類するための、実践的で完全に自己管理されたフレームワークについて説明する。
論文 参考訳(メタデータ) (2023-05-10T14:04:21Z) - Exploring Invariant Representation for Visible-Infrared Person
Re-Identification [77.06940947765406]
異なるスペクトルを横断する歩行者にアイデンティティを関連付けることを目的とした、クロススペクトルの人物再識別は、モダリティの相違の主な課題に直面している。
本稿では、ロバスト機能マイニングネットワーク(RFM)と呼ばれるエンドツーエンドのハイブリッド学習フレームワークにおいて、画像レベルと特徴レベルの両方の問題に対処する。
RegDBとSYSU-MM01という2つの標準的なクロススペクトル人物識別データセットの実験結果により,最先端の性能が示された。
論文 参考訳(メタデータ) (2023-02-02T05:24:50Z) - Towards Homogeneous Modality Learning and Multi-Granularity Information
Exploration for Visible-Infrared Person Re-Identification [16.22986967958162]
Visible-infrared person re-identification (VI-ReID) は、可視・赤外線カメラビューを介して人物画像の集合を検索することを目的とした、困難かつ必須の課題である。
従来の手法では, GAN (Generative Adversarial Network) を用いて, モーダリティ・コンシデント・データを生成する手法が提案されている。
そこで本研究では、視線外デュアルモード学習をグレーグレー単一モード学習問題として再構成する、統一されたダークラインスペクトルであるAligned Grayscale Modality (AGM)を用いて、モード間マッチング問題に対処する。
論文 参考訳(メタデータ) (2022-04-11T03:03:19Z) - Transformer-empowered Multi-scale Contextual Matching and Aggregation
for Multi-contrast MRI Super-resolution [55.52779466954026]
マルチコントラスト・スーパーレゾリューション (SR) 再構成により, SR画像の高画質化が期待できる。
既存の手法では、これらの特徴をマッチングし、融合させる効果的なメカニズムが欠如している。
そこで本稿では,トランスフォーマーを利用したマルチスケールコンテキストマッチングとアグリゲーション技術を開発することで,これらの問題を解決する新しいネットワークを提案する。
論文 参考訳(メタデータ) (2022-03-26T01:42:59Z) - Modality-Adaptive Mixup and Invariant Decomposition for RGB-Infrared
Person Re-Identification [84.32086702849338]
RGB-赤外線人物再同定のための新しいモダリティ適応混合・不変分解(MID)手法を提案する。
MIDは、RGBと赤外線画像の混合画像を生成するためのモダリティ適応混合方式を設計する。
2つの挑戦的なベンチマーク実験は、最先端の手法よりもMIDの優れた性能を示す。
論文 参考訳(メタデータ) (2022-03-03T14:26:49Z) - MSO: Multi-Feature Space Joint Optimization Network for RGB-Infrared
Person Re-Identification [35.97494894205023]
RGB-infrared cross-modality person re-identification (ReID) タスクは、可視モダリティと赤外線モダリティの同一性の画像を認識することを目的としている。
既存の手法は主に2ストリームアーキテクチャを使用して、最終的な共通特徴空間における2つのモード間の相違を取り除く。
単一モダリティ空間と共通空間の両方において、モダリティ調和可能な特徴を学習できる新しい多機能空間共同最適化(MSO)ネットワークを提案する。
論文 参考訳(メタデータ) (2021-10-21T16:45:23Z) - SFANet: A Spectrum-aware Feature Augmentation Network for
Visible-Infrared Person Re-Identification [12.566284647658053]
クロスモダリティマッチング問題に対するSFANetという新しいスペクトル認識特徴量化ネットワークを提案する。
grayscale-spectrumイメージで学習すると、モダリティの不一致を低減し、内部構造関係を検出することができる。
特徴レベルでは、特定および粉砕可能な畳み込みブロックの数のバランスをとることにより、従来の2ストリームネットワークを改善します。
論文 参考訳(メタデータ) (2021-02-24T08:57:32Z) - Dynamic Dual-Attentive Aggregation Learning for Visible-Infrared Person
Re-Identification [208.1227090864602]
Visible-infrared person re-identification (VI-ReID) は、歩行者検索の課題である。
既存のVI-ReID法は、識別可能性に制限があり、ノイズの多い画像に対して弱いロバスト性を持つグローバル表現を学習する傾向にある。
そこで我々は,VI-ReIDのための動的二段階集合(DDAG)学習法を提案する。
論文 参考訳(メタデータ) (2020-07-18T03:08:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。