論文の概要: Batch Coherence-Driven Network for Part-aware Person Re-Identification
- arxiv url: http://arxiv.org/abs/2009.09692v2
- Date: Fri, 7 May 2021 07:21:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-16 05:09:28.366331
- Title: Batch Coherence-Driven Network for Part-aware Person Re-Identification
- Title(参考訳): 部分認識者再識別のためのバッチコヒーレンス駆動ネットワーク
- Authors: Kan Wang, Pengfei Wang, Changxing Ding, and Dacheng Tao
- Abstract要約: 既存のパートアウェアの人物再識別方法は、通常、ボディ部分の検出と部分レベルの特徴抽出という2つのステップを使用する。
トレーニングフェーズとテストフェーズの両方で身体の一部をバイパスし,セマンティックに整合した機能を実現するNetworkBCDNetを提案する。
- 参考スコア(独自算出の注目度): 79.33809815035127
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing part-aware person re-identification methods typically employ two
separate steps: namely, body part detection and part-level feature extraction.
However, part detection introduces an additional computational cost and is
inherently challenging for low-quality images. Accordingly, in this work, we
propose a simple framework named Batch Coherence-Driven Network (BCD-Net) that
bypasses body part detection during both the training and testing phases while
still learning semantically aligned part features. Our key observation is that
the statistics in a batch of images are stable, and therefore that batch-level
constraints are robust. First, we introduce a batch coherence-guided channel
attention (BCCA) module that highlights the relevant channels for each
respective part from the output of a deep backbone model. We investigate
channelpart correspondence using a batch of training images, then impose a
novel batch-level supervision signal that helps BCCA to identify part-relevant
channels. Second, the mean position of a body part is robust and consequently
coherent between batches throughout the training process. Accordingly, we
introduce a pair of regularization terms based on the semantic consistency
between batches. The first term regularizes the high responses of BCD-Net for
each part on one batch in order to constrain it within a predefined area, while
the second encourages the aggregate of BCD-Nets responses for all parts
covering the entire human body. The above constraints guide BCD-Net to learn
diverse, complementary, and semantically aligned part-level features. Extensive
experimental results demonstrate that BCDNet consistently achieves
state-of-the-art performance on four large-scale ReID benchmarks.
- Abstract(参考訳): 既存の人物再同定法は、通常、身体部位検出と部分レベル特徴抽出という2つの異なるステップを用いる。
しかし、部分検出では計算コストが増大し、画質の低い画像では本質的に困難である。
そこで本研究では,学習段階とテスト段階の両方において身体部位検出をバイパスするバッチコヒーレンス駆動ネットワーク(bcd-net)というシンプルなフレームワークを提案する。
私たちの重要な観察は、画像のバッチ内の統計は安定しており、したがってバッチレベルの制約は堅牢であるということです。
まず、深部バックボーンモデルの出力から各部分の関連チャネルをハイライトするバッチコヒーレンス誘導チャネルアテンション(BCCA)モジュールを導入する。
我々は,一連の訓練画像を用いてチャネル部分対応を調査し,BCCAが関連するチャネルを識別するのに役立つ新しいバッチレベルの監視信号を与える。
第二に、体部の平均位置は堅牢であり、訓練過程全体を通してバッチ間でコヒーレントである。
そこで本研究では,バッチ間のセマンティック一貫性に基づく正規化用語のペアを導入する。
第1の項は、予め定義された領域内で制限するために、バッチの各部分に対するbcd-netの高応答を規則化し、第2の項は、人体全体を覆う全部分に対するbcd-nets応答の集約を奨励する。
上記の制約により、BCD-Netは多様な補完的、意味的に整合した部分レベルの機能を学ぶことができる。
BCDNetは4つの大規模ReIDベンチマークで常に最先端の性能を達成している。
関連論文リスト
- Unified Batch Normalization: Identifying and Alleviating the Feature
Condensation in Batch Normalization and a Unified Framework [55.22949690864962]
バッチ正規化(BN)は、現代のニューラルネットワーク設計において欠かせない技術となっている。
UBN(Unified Batch Normalization)と呼ばれる2段階統合フレームワークを提案する。
UBNは異なる視覚バックボーンと異なる視覚タスクのパフォーマンスを大幅に向上させる。
論文 参考訳(メタデータ) (2023-11-27T16:41:31Z) - FDNet: Feature Decoupled Segmentation Network for Tooth CBCT Image [5.728846115248074]
本稿では,CBCTスキャンで遭遇する歯質変化状況に優れた特徴デカップリングネットワークであるFDNetを提案する。
フレームワークの有効性は厳格なベンチマークによって検証され、それぞれ85.28%と75.23%のDiceとIoUのスコアを達成している。
論文 参考訳(メタデータ) (2023-11-11T12:00:24Z) - GaitStrip: Gait Recognition via Effective Strip-based Feature
Representations and Multi-Level Framework [34.397404430838286]
本稿では,様々なレベルの歩行情報を抽出するために,GaitStripという名前のストリップベースマルチレベル歩行認識ネットワークを提案する。
具体的には、私たちの高レベルブランチは歩行シーケンスのコンテキストを探求し、低レベルブランチは詳細な姿勢変化に焦点を当てています。
我々のGaitStripは、通常の歩行条件と複雑な歩行条件の両方において最先端の性能を達成する。
論文 参考訳(メタデータ) (2022-03-08T09:49:48Z) - Real-Time Scene Text Detection with Differentiable Binarization and
Adaptive Scale Fusion [62.269219152425556]
セグメンテーションに基づくシーンテキスト検出手法はシーンテキスト検出分野において大きな注目を集めている。
本稿では,二項化処理をセグメンテーションネットワークに統合する分散二項化(DB)モジュールを提案する。
アダプティブ・スケール・フュージョン (ASF) モジュールは, 異なるスケールの特徴を適応的に融合させることにより, スケールのロバスト性を向上させる。
論文 参考訳(メタデータ) (2022-02-21T15:30:14Z) - Pose-Guided Feature Learning with Knowledge Distillation for Occluded
Person Re-Identification [137.8810152620818]
PGFL-KD (Pose-Guided Feature Learning with Knowledge Distillation) というネットワークを提案する。
PGFL-KDは、メインブランチ(MB)と2つのポーズ誘導ブランチ(ieno)、フォアグラウンド強化ブランチ(FEB)、ボディ部分セマンティクス整列ブランチ(SAB)から構成される。
閉鎖型,部分的,包括型 ReID タスクの実験は,提案したネットワークの有効性を示す。
論文 参考訳(メタデータ) (2021-07-31T03:34:27Z) - BiCnet-TKS: Learning Efficient Spatial-Temporal Representation for Video
Person Re-Identification [86.73532136686438]
映像人物再識別(reID)のための効率的な時空間表現法を提案する。
空間相補性モデリングのための双方向相補性ネットワーク(BiCnet)を提案する。
BiCnet-TKSは、約50%の計算量で最先端の性能を発揮する。
論文 参考訳(メタデータ) (2021-04-30T06:44:34Z) - Toward Real-World BCI: CCSPNet, A Compact Subject-Independent Motor
Imagery Framework [2.0741711594051377]
従来の脳-コンピュータインタフェース(BCI)は、使用前に各ユーザーに対して完全なデータ収集、トレーニング、校正フェーズを必要とする。
大規模脳波信号データベースの運動画像(MI)パラダイムを学習するCCSPNetという,新規な主体に依存しないBCIフレームワークを提案する。
提案手法は,ウェーブレット核畳み込みニューラルネットワーク(wkcnn)と時間畳み込みニューラルネットワーク(tcnn)を適用し,脳波信号の多様なスペクトル特性を表現・抽出する。
論文 参考訳(メタデータ) (2020-12-25T12:00:47Z) - Gradient-Induced Co-Saliency Detection [81.54194063218216]
Co-SOD(Co-saliency Detection)は、一般的な唾液前景を関連画像のグループに分割することを目的としている。
本稿では,人間の行動にインスパイアされた,勾配誘導型共分散検出法を提案する。
論文 参考訳(メタデータ) (2020-04-28T08:40:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。