論文の概要: Towards Generalizable Person Re-identification with a Bi-stream
Generative Model
- arxiv url: http://arxiv.org/abs/2206.09362v1
- Date: Sun, 19 Jun 2022 09:18:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-22 17:04:03.980119
- Title: Towards Generalizable Person Re-identification with a Bi-stream
Generative Model
- Title(参考訳): バイストリーム生成モデルによる人物再同定の一般化に向けて
- Authors: Xin Xu, Wei Liu, Zheng Wang, Ruiming Hu, Qi Tian
- Abstract要約: そこで我々は,BGM (Bi-stream Generative Model) を提案する。
提案手法は,大規模な一般化可能なre-IDベンチマークにおいて,最先端の手法よりも優れている。
- 参考スコア(独自算出の注目度): 81.0989316825134
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generalizable person re-identification (re-ID) has attracted growing
attention due to its powerful adaptation capability in the unseen data domain.
However, existing solutions often neglect either crossing cameras (e.g.,
illumination and resolution differences) or pedestrian misalignments (e.g.,
viewpoint and pose discrepancies), which easily leads to poor generalization
capability when adapted to the new domain. In this paper, we formulate these
difficulties as: 1) Camera-Camera (CC) problem, which denotes the various human
appearance changes caused by different cameras; 2) Camera-Person (CP) problem,
which indicates the pedestrian misalignments caused by the same identity person
under different camera viewpoints or changing pose. To solve the above issues,
we propose a Bi-stream Generative Model (BGM) to learn the fine-grained
representations fused with camera-invariant global feature and
pedestrian-aligned local feature, which contains an encoding network and two
stream decoding sub-networks. Guided by original pedestrian images, one stream
is employed to learn a camera-invariant global feature for the CC problem via
filtering cross-camera interference factors. For the CP problem, another stream
learns a pedestrian-aligned local feature for pedestrian alignment using
information-complete densely semantically aligned part maps. Moreover, a
part-weighted loss function is presented to reduce the influence of missing
parts on pedestrian alignment. Extensive experiments demonstrate that our
method outperforms the state-of-the-art methods on the large-scale
generalizable re-ID benchmarks, involving domain generalization setting and
cross-domain setting.
- Abstract(参考訳): 一般化可能な人物識別(re-ID)は、目に見えないデータ領域における強力な適応能力によって注目を集めている。
しかし、既存の解決策は、横断カメラ(例えば、照明と解像度の違い)や歩行者のミスアライメント(例えば、視点とポーズの相違)を無視することが多く、新しい領域に適応する際の一般化能力の低下につながる。
本稿では,これらの困難を次のように定式化する。
1)カメラカメラ(CC)問題は、異なるカメラによって引き起こされる様々な人間の外見の変化を示す。
2)カメラ・パーソン(CP)問題とは,カメラの視点やポーズの変化によって同一人物が引き起こした歩行者の不一致を指す。
上記の課題を解決するため,BGM (Bi-stream Generative Model) を提案し,符号化ネットワークと2つのストリーム復号サブネットワークを含む,カメラ不変のグローバル機能と歩行者対応のローカル機能とを融合した微細な表現を学習する。
オリジナルの歩行者画像に導かれ、カメラ間干渉因子をフィルタリングすることでcc問題に対するカメラ不変なグローバル特徴を学ぶために1つのストリームが使用される。
CP問題に対して、別のストリームは、情報完全で意味的に整合した部分マップを用いて、歩行者が整列する局所的な特徴を学習する。
さらに、歩行者アライメントに対する欠落部分の影響を低減するために、部分重み付き損失関数を示す。
大規模な一般化可能なre-IDベンチマークでは,ドメインの一般化設定やクロスドメイン設定を含む,最先端の手法よりも優れた結果が得られた。
関連論文リスト
- ChangeBind: A Hybrid Change Encoder for Remote Sensing Change Detection [16.62779899494721]
変化検出(CD)は、異なる時刻スタンプで同じ地理的領域間の意味的変化を検出することを目的とした、リモートセンシング(RS)の基本課題である。
本稿では,バイテンポラルRS画像における意味変化をエンコードする,効果的なSiameseベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-26T17:47:14Z) - Domain-adaptive Person Re-identification without Cross-camera Paired
Samples [12.041823465553875]
長距離シーンから収集されたクロスカメラ歩行者のサンプルには、ポジティブなサンプルがないことが多い。
クロスカメラの負のサンプルを用いて、地域間歩行者の同一性マッチングを実現することは極めて困難である。
クロスカメラ一貫した識別特徴学習に焦点を当てた新しいドメイン適応型人物認識手法を提案する。
論文 参考訳(メタデータ) (2023-07-13T02:42:28Z) - Occluded Person Re-Identification via Relational Adaptive Feature
Correction Learning [8.015703163954639]
複数のカメラが捉えた画像中の被写体再識別(Re-ID)は、歩行者や物体が被写体を隠蔽しているため困難である。
既存のほとんどの手法では、ネットワークを擬似ラベルとして利用しており、エラーを起こしやすい。
本稿では,Occlusion Correction Network (OCNet) を提案する。Occlusion Correction Network (OCNet) は,リレーショナル・ウェイト・ラーニングによって特徴を補正し,外部ネットワークを使わずに多様で代表的な特徴を得られる。
論文 参考訳(メタデータ) (2022-12-09T07:48:47Z) - Cross-modal Local Shortest Path and Global Enhancement for
Visible-Thermal Person Re-Identification [2.294635424666456]
本稿では,局所的特徴とグローバル的特徴の同時学習に基づく2ストリームネットワークであるCM-LSP-GE(Cross-modal Local Shortest Path and Global Enhancement)モジュールを提案する。
2つの典型的なデータセットの実験結果は、我々のモデルは明らかに最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2022-06-09T10:27:22Z) - AF$_2$: Adaptive Focus Framework for Aerial Imagery Segmentation [86.44683367028914]
航空画像のセグメンテーションにはいくつかの独特な課題があり、中でも最も重要なものは前景と背景のアンバランスにある。
本稿では,階層的なセグメンテーション手法を採用し,マルチスケール表現を適応的に活用するAdaptive Focus Framework (AF$)を提案する。
AF$は、広く使われている3つの航空ベンチマークの精度を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-18T10:14:45Z) - Cross-Camera Feature Prediction for Intra-Camera Supervised Person
Re-identification across Distant Scenes [70.30052164401178]
人物再識別(Re-ID)は、重複しないカメラビュー間で人物画像をマッチングすることを目的としている。
ICS-DS Re-IDは、カメラ内IDラベル付きクロスカメラアンペアデータを使用してトレーニングを行う。
カメラ横断型自己監視情報マイニングのためのクロスカメラ特徴予測法
グローバルレベルの特徴とローカルレベルの特徴の合同学習は、グローバルなローカルなクロスカメラ特徴予測スキームを形成する。
論文 参考訳(メタデータ) (2021-07-29T11:27:50Z) - Looking Twice for Partial Clues: Weakly-supervised Part-Mentored
Attention Network for Vehicle Re-Identification [18.539658212171062]
PMANet(Part-Mentored Attention Network)とPMNet(Part-Mentored Network)は、グローバルかつローカルな特徴集約を指導する。
提案手法は,VabyIDではCMC@1が平均2.63%,VeRi776では2.2%,最新の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2021-07-17T12:19:12Z) - Cloth-Changing Person Re-identification from A Single Image with Gait
Prediction and Regularization [65.50321170655225]
本稿では,画像レイドモデルを用いて布非依存表現を学習するための補助タスクとして,歩行認識を導入する。
画像ベースのCloth-Changing ReIDベンチマーク(例えば、LTCC、PRCC、Real28、VC-Clothes)の実験は、GI-ReIDが最先端技術に対して好適に動作することを示した。
論文 参考訳(メタデータ) (2021-03-29T12:10:50Z) - Watching You: Global-guided Reciprocal Learning for Video-based Person
Re-identification [82.6971648465279]
映像に基づくRe-IDのための新しいグローバルガイド相互学習フレームワークを提案する。
我々のアプローチは他の最先端のアプローチよりも優れたパフォーマンスを達成できます。
論文 参考訳(メタデータ) (2021-03-07T12:27:42Z) - Channel-wise Alignment for Adaptive Object Detection [66.76486843397267]
遺伝的物体検出は、ディープ畳み込みニューラルネットワークの開発によって大いに促進されている。
このタスクの既存の方法は、通常、画像全体や関心の対象に基づいて、ハイレベルなアライメントに注意を向ける。
本稿では,チャネルワイドアライメント(チャネルワイドアライメント)という,まったく異なる観点からの適応を実現する。
論文 参考訳(メタデータ) (2020-09-07T02:42:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。