論文の概要: Progressive Multi-stage Feature Mix for Person Re-Identification
- arxiv url: http://arxiv.org/abs/2007.08779v2
- Date: Mon, 26 Oct 2020 06:39:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-09 13:57:13.765128
- Title: Progressive Multi-stage Feature Mix for Person Re-Identification
- Title(参考訳): 人物再同定のためのプログレッシブ多段特徴混合
- Authors: Yan Zhang, Binyu He, Li Sun
- Abstract要約: CNNは、最も健康な地域に対してあまりに多くの注意を払っている。
%BDBは、高い応答領域を拡大するために、1ブロックをランダムにバッチにドロップすることを提案する。
本稿では,より正確で多様な特徴を段階的に把握できるPMM(Progressive Multi-stage Feature Mix Network)を提案する。
- 参考スコア(独自算出の注目度): 11.161336369536818
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image features from a small local region often give strong evidence in person
re-identification task. However, CNN suffers from paying too much attention on
the most salient local areas, thus ignoring other discriminative clues, e.g.,
hair, shoes or logos on clothes. %BDB proposes to randomly drop one block in a
batch to enlarge the high response areas. Although BDB has achieved remarkable
results, there still room for improvement. In this work, we propose a
Progressive Multi-stage feature Mix network (PMM), which enables the model to
find out the more precise and diverse features in a progressive manner.
Specifically, 1. to enforce the model to look for different clues in the image,
we adopt a multi-stage classifier and expect that the model is able to focus on
a complementary region in each stage. 2. we propose an Attentive feature
Hard-Mix (A-Hard-Mix) to replace the salient feature blocks by the negative
example in the current batch, whose label is different from the current sample.
3. extensive experiments have been carried out on reID datasets such as the
Market-1501, DukeMTMC-reID and CUHK03, showing that the proposed method can
boost the re-identification performance significantly.
- Abstract(参考訳): 小さな地域の画像の特徴は、しばしば人物の再識別作業において強い証拠を与える。
しかし、cnnは最も塩分の多い地域に注意を払いすぎており、服の髪、靴、ロゴなど他の差別的な手がかりを無視している。
%BDBは、高い応答領域を拡大するために、1ブロックをランダムにバッチにドロップすることを提案する。
BDBは目覚ましい成果を上げましたが、改善の余地はまだあります。
本研究では,より正確で多様な特徴を段階的に把握できるPMM(Progressive Multi-stage Feature Mix Network)を提案する。
具体的には
1. 画像の異なる手がかりを探すためにモデルを強制するために、我々は多段階分類器を採用し、モデルが各段階の補完領域に集中できることを期待している。
2) 現在のバッチにおいて, ラベルが現在のサンプルと異なる負の例によって, 健全な特徴ブロックを置き換えるための注意機能(A-Hard-Mix)を提案する。
3. マーケット-1501, デュークMTMC-reID, CUHK03などのreIDデータセットに対する広範な実験を行い, 提案手法が再同定性能を大幅に向上させることができることを示した。
関連論文リスト
- Cross-video Identity Correlating for Person Re-identification Pre-training [38.43616465478059]
本稿では,CION(Cross-video Identity-cOrrelating Pre-TraiNing)フレームワークを提案する。
CIONは、プログレッシブなマルチレベル denoising 問題としてモデル化することで、クロスビデオ画像からの同一性相関を求める。
また,この分野での多様な研究や応用ニーズを満たすため,ReIDZooというモデル動物園を寄贈した。
論文 参考訳(メタデータ) (2024-09-27T09:12:33Z) - Matryoshka Multimodal Models [92.41824727506751]
我々はM3: Matryoshka Multimodal Modelsを提案する。
COCOスタイルのベンチマークでは,576個のトークンを使用する場合と同様の精度を得るために,9個のビジュアルトークンしか必要としないことがわかった。
論文 参考訳(メタデータ) (2024-05-27T17:59:56Z) - Magic Tokens: Select Diverse Tokens for Multi-modal Object Re-Identification [64.36210786350568]
マルチモーダルオブジェクトReIDのための視覚変換器から多様なトークンを選択するための,textbfEDITORという新しい学習フレームワークを提案する。
我々のフレームワークはマルチモーダルオブジェクトReIDに対してより差別的な機能を生成することができる。
論文 参考訳(メタデータ) (2024-03-15T12:44:35Z) - Exploring Diverse Representations for Open Set Recognition [51.39557024591446]
オープンセット認識(OSR)では、テスト中に未知のサンプルを拒絶しながら、クローズドセットに属するサンプルを分類する必要がある。
現在、生成モデルはOSRの差別モデルよりもよく機能している。
本稿では,多種多様な表現を識別的に学習するMulti-Expert Diverse Attention Fusion(MEDAF)を提案する。
論文 参考訳(メタデータ) (2024-01-12T11:40:22Z) - Hierarchical Forgery Classifier On Multi-modality Face Forgery Clues [61.37306431455152]
我々は,HFC-MFFD (hierarchical Forgery for Multi-modality Face Forgery Detection) を提案する。
HFC-MFFDは、マルチモーダルシナリオにおけるフォージェリー認証を強化するために、堅牢なパッチベースのハイブリッド表現を学習する。
クラス不均衡問題を緩和し、さらに検出性能を高めるために、特定の階層的な顔偽造を提案する。
論文 参考訳(メタデータ) (2022-12-30T10:54:29Z) - TriPINet: Tripartite Progressive Integration Network for Image
Manipulation Localization [3.7359400978194675]
本稿では,3部構成のプログレッシブ統合ネットワーク(TriPINet)を提案する。
我々は,異なる種類の手掛かりを融合させるガイド付きクロスモーダリティ・デュアルアテンション(gCMDA)モジュールを開発した。
本手法と最先端画像鑑定法との比較のために, 大規模な実験を行った。
論文 参考訳(メタデータ) (2022-12-25T02:27:58Z) - Dynamic Prototype Mask for Occluded Person Re-Identification [88.7782299372656]
既存の手法では、目に見える部分を識別するために、余分なネットワークによって提供される身体の手がかりを利用することで、この問題に対処している。
2つの自己明快な事前知識に基づく新しい動的プロトタイプマスク(DPM)を提案する。
この条件下では、隠蔽された表現は、選択された部分空間において自然にうまく整列することができる。
論文 参考訳(メタデータ) (2022-07-19T03:31:13Z) - Exploring the Diversity and Invariance in Yourself for Visual
Pre-Training Task [192.74445148376037]
自己指導型学習法は視覚前訓練において顕著な成功を収めた。
これらの手法は、限られた領域のみに焦点を当てたり、抽出された特徴を各画像内の全く異なる領域に当てはめることはほぼ同じである。
本稿では,自身のE-DIYにおける多様性と不変性を探究する。
論文 参考訳(メタデータ) (2021-06-01T14:52:36Z) - Diversity-Achieving Slow-DropBlock Network for Person Re-Identification [11.907116133358022]
マルチブランチネットワークアーキテクチャを使用した人物再識別(Re-ID)の大きな課題は、IDラベル付きデータセットから多様な特徴を学習することだ。
BDB(Batch DropBlock)ネットワークは近年,グローバルブランチと機能ドロップブランチの多様性を実現するために提案されている。
提案手法は, Market-1501, DukeMTMC-reID, CUHK03 などの人気人物 Re-ID データセットに対して,BDB よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-02-09T08:05:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。