論文の概要: G$^2$DA: Geometry-Guided Dual-Alignment Learning for RGB-Infrared Person
Re-Identification
- arxiv url: http://arxiv.org/abs/2106.07853v1
- Date: Tue, 15 Jun 2021 03:14:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-16 15:14:04.769713
- Title: G$^2$DA: Geometry-Guided Dual-Alignment Learning for RGB-Infrared Person
Re-Identification
- Title(参考訳): G$^2$DA:RGB赤外線人物再同定のための幾何誘導デュアルアライメント学習
- Authors: Lin Wan, Zongyuan Sun, Qianyan Jing, Yehansen Chen, Lijing Lu, and
Zhihang Li
- Abstract要約: RGB-IRの人物再識別は、異種間の興味のある人物を検索することを目的としている。
本稿では,サンプルレベルのモダリティ差に対処するための幾何誘導デュアルアライメント学習フレームワーク(G$2$DA)を提案する。
- 参考スコア(独自算出の注目度): 3.909938091041451
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: RGB-Infrared (IR) person re-identification aims to retrieve
person-of-interest between heterogeneous modalities, suffering from large
modality discrepancy caused by different sensory devices. Existing methods
mainly focus on global-level modality alignment, whereas neglect sample-level
modality divergence to some extent, leading to performance degradation. This
paper attempts to find RGB-IR ReID solutions from tackling sample-level
modality difference, and presents a Geometry-Guided Dual-Alignment learning
framework (G$^2$DA), which jointly enhances modality-invariance and reinforces
discriminability with human topological structure in features to boost the
overall matching performance. Specifically, G$^2$DA extracts accurate body part
features with a pose estimator, serving as a semantic bridge complementing the
missing local details in global descriptor. Based on extracted local and global
features, a novel distribution constraint derived from optimal transport is
introduced to mitigate the modality gap in a fine-grained sample-level manner.
Beyond pair-wise relations across two modalities, it additionally measures the
structural similarity of different parts, thus both multi-level features and
their relations are kept consistent in the common feature space. Considering
the inherent human-topology information, we further advance a geometry-guided
graph learning module to refine each part features, where relevant regions can
be emphasized while meaningless ones are suppressed, effectively facilitating
robust feature learning. Extensive experiments on two standard benchmark
datasets validate the superiority of our proposed method, yielding competitive
performance over the state-of-the-art approaches.
- Abstract(参考訳): rgb-infrared (ir) person re-identificationは、異なる感覚装置によって引き起こされる大きなモダリティの不一致に苦しむ異質なモダリティ間の興味の人格を検索することを目的としている。
既存の手法は主にグローバルレベルのモダリティアライメントに重点を置いているが、サンプルレベルのモダリティはある程度の相違が無視され、パフォーマンスが低下する。
本稿では,サンプルレベルのモダリティ差からrgb-irのreid解を見つけ出し,モダリティ不変性(modality-invariance)を強化し,人間の位相構造との識別性を強化し,全体的なマッチング性能を向上させる幾何ガイド付きデュアルアリゲーション学習フレームワーク(g$^2$da)を提案する。
具体的には、G$^2$DAは、グローバルディスクリプタの欠落したローカル詳細を補完するセマンティックブリッジとして機能するポーズ推定器で正確な身体部分の特徴を抽出する。
抽出された局所的および大域的な特徴に基づき、最適輸送に由来する新しい分布制約を導入し、細粒度サンプルレベルでのモーダリティギャップを緩和する。
2つのモダリティをまたいだ対関係を超えて、異なる部分の構造的類似性も測定するので、多レベル特徴とそれらの関係は共通の特徴空間で一貫して保たれる。
固有な人間-トポロジ情報を考慮して,各部分の特徴を洗練するための幾何誘導型グラフ学習モジュールをさらに前進させ,無意味な特徴を抑圧しながら関連領域を強調し,堅牢な特徴学習を効果的に促進する。
2つの標準ベンチマークデータセットに関する広範囲な実験により,提案手法の優位性が検証された。
関連論文リスト
- Learning Generalizable Agents via Saliency-Guided Features Decorrelation [25.19044461705711]
特徴と判断の相関をなくすために,サリエンシガイド機能デコレーションを提案する。
RFFは高次元画像における複雑な非線形相関を推定するために利用され、サリエンシマップは変化した特徴を識別するために設計されている。
サリエンシマップの指導のもと、SGFDはサンプル再重み付けを用いて、変化した特徴に関する推定相関を最小化する。
論文 参考訳(メタデータ) (2023-10-08T09:24:43Z) - Disentangled Federated Learning for Tackling Attributes Skew via
Invariant Aggregation and Diversity Transferring [104.19414150171472]
属性は、クライアント間の一貫した最適化方向から、現在の連邦学習(FL)フレームワークを歪めます。
本稿では,ドメイン固有属性とクロス不変属性を2つの補足枝に分離するために,非絡み付きフェデレーション学習(DFL)を提案する。
実験により、DFLはSOTA FL法と比較して高い性能、より良い解釈可能性、より高速な収束率でFLを促進することが確認された。
論文 参考訳(メタデータ) (2022-06-14T13:12:12Z) - Relation Matters: Foreground-aware Graph-based Relational Reasoning for
Domain Adaptive Object Detection [81.07378219410182]
我々は、FGRR(Fearground-aware Graph-based Reasoning)というドメインDのための新しい汎用フレームワークを提案する。
FGRRはグラフ構造を検出パイプラインに組み込んで、ドメイン内およびドメイン間フォアグラウンドオブジェクト関係を明示的にモデル化する。
実験の結果、提案したFGRRは4つのDomainDベンチマークの最先端よりも優れていることが示された。
論文 参考訳(メタデータ) (2022-06-06T05:12:48Z) - On Exploring Pose Estimation as an Auxiliary Learning Task for
Visible-Infrared Person Re-identification [66.58450185833479]
本稿では,Pose Estimationを補助学習タスクとして活用して,エンドツーエンドフレームワークにおけるVI-ReIDタスクを支援する。
これら2つのタスクを相互に有利な方法で共同でトレーニングすることにより、高品質なモダリティ共有とID関連の特徴を学習する。
2つのベンチマークVI-ReIDデータセットの実験結果から,提案手法は一定のマージンで最先端の手法を継続的に改善することが示された。
論文 参考訳(メタデータ) (2022-01-11T09:44:00Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - MSO: Multi-Feature Space Joint Optimization Network for RGB-Infrared
Person Re-Identification [35.97494894205023]
RGB-infrared cross-modality person re-identification (ReID) タスクは、可視モダリティと赤外線モダリティの同一性の画像を認識することを目的としている。
既存の手法は主に2ストリームアーキテクチャを使用して、最終的な共通特徴空間における2つのモード間の相違を取り除く。
単一モダリティ空間と共通空間の両方において、モダリティ調和可能な特徴を学習できる新しい多機能空間共同最適化(MSO)ネットワークを提案する。
論文 参考訳(メタデータ) (2021-10-21T16:45:23Z) - DF^2AM: Dual-level Feature Fusion and Affinity Modeling for RGB-Infrared
Cross-modality Person Re-identification [18.152310122348393]
RGB-赤外線による人物再識別は、クラス内変異とモダリティの相違が原因で難しい課題である。
我々は,局所的・グローバル的特徴融合(df2)モジュールを,局所的特徴とグローバル的特徴の区別に着目して提案する。
人物画像からグローバルな特徴間の関係をさらに掘り下げるために,親和性モデリング(AM)モジュールを提案する。
論文 参考訳(メタデータ) (2021-04-01T03:12:56Z) - Cross-Domain Facial Expression Recognition: A Unified Evaluation
Benchmark and Adversarial Graph Learning [85.6386289476598]
我々は,クロスドメイン全体的特徴共適応のための新しい逆グラフ表現適応(AGRA)フレームワークを開発した。
我々は,いくつかの一般的なベンチマークで広範囲かつ公平な評価を行い,提案したAGRAフレームワークが従来の最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-08-03T15:00:31Z) - Dynamic Dual-Attentive Aggregation Learning for Visible-Infrared Person
Re-Identification [208.1227090864602]
Visible-infrared person re-identification (VI-ReID) は、歩行者検索の課題である。
既存のVI-ReID法は、識別可能性に制限があり、ノイズの多い画像に対して弱いロバスト性を持つグローバル表現を学習する傾向にある。
そこで我々は,VI-ReIDのための動的二段階集合(DDAG)学習法を提案する。
論文 参考訳(メタデータ) (2020-07-18T03:08:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。