論文の概要: Deep Miner: A Deep and Multi-branch Network which Mines Rich and Diverse
Features for Person Re-identification
- arxiv url: http://arxiv.org/abs/2102.09321v1
- Date: Thu, 18 Feb 2021 13:30:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-19 14:19:31.469029
- Title: Deep Miner: A Deep and Multi-branch Network which Mines Rich and Diverse
Features for Person Re-identification
- Title(参考訳): Deep Miner: 個人再識別のためのリッチで多様な機能をマイニングするディープおよびマルチブランチネットワーク
- Authors: Abdallah Benzine, Mohamed El Amine Seddik, Julien Desmarais
- Abstract要約: Deep Minerは、CNNが人々に関するより豊かで多様な機能を「マイニング」することを可能にする方法です。
これは、最先端(SOTA)再識別法を著しく上回るモデルを生成する。
- 参考スコア(独自算出の注目度): 7.068680287596106
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Most recent person re-identification approaches are based on the use of deep
convolutional neural networks (CNNs). These networks, although effective in
multiple tasks such as classification or object detection, tend to focus on the
most discriminative part of an object rather than retrieving all its relevant
features. This behavior penalizes the performance of a CNN for the
re-identification task, since it should identify diverse and fine grained
features. It is then essential to make the network learn a wide variety of
finer characteristics in order to make the re-identification process of people
effective and robust to finer changes. In this article, we introduce Deep
Miner, a method that allows CNNs to "mine" richer and more diverse features
about people for their re-identification. Deep Miner is specifically composed
of three types of branches: a Global branch (G-branch), a Local branch
(L-branch) and an Input-Erased branch (IE-branch). G-branch corresponds to the
initial backbone which predicts global characteristics, while L-branch
retrieves part level resolution features. The IE-branch for its part, receives
partially suppressed feature maps as input thereby allowing the network to
"mine" new features (those ignored by G-branch) as output. For this special
purpose, a dedicated suppression procedure for identifying and removing
features within a given CNN is introduced. This suppression procedure has the
major benefit of being simple, while it produces a model that significantly
outperforms state-of-the-art (SOTA) re-identification methods. Specifically, we
conduct experiments on four standard person re-identification benchmarks and
witness an absolute performance gain up to 6.5% mAP compared to SOTA.
- Abstract(参考訳): 最近の人物再識別アプローチは、ディープ畳み込みニューラルネットワーク(CNN)の利用に基づいている。
これらのネットワークは、分類やオブジェクト検出などの複数のタスクで有効であるが、関連するすべての特徴を検索するよりも、オブジェクトの最も差別的な部分に焦点を当てる傾向がある。
この振る舞いは、多種多様できめ細かい特徴を識別する必要があるため、再識別タスクにおけるCNNのパフォーマンスを罰する。
そこで, ネットワークにさまざまな特性を学習させ, 人々の再識別プロセスを効果的かつ堅牢にし, 変化をより細かくする上で重要である。
本稿では,CNNがより豊かで多様な特徴を識別し,その再識別を可能にする手法であるDeep Minerを紹介する。
Deep Minerは、Globalブランチ(Gブランチ)、Localブランチ(Lブランチ)、Input-Erasedブランチ(IEブランチ)の3つのタイプのブランチで構成されている。
Gブランチはグローバル特性を予測する最初のバックボーンに対応し、Lブランチは部品レベルの解像度特性を取得します。
IEブランチは、部分的に抑圧された特徴マップを入力として受け取り、ネットワークが新たな特徴(Gブランチによって無視される)を出力として"マイニング"することができる。
この目的のために、所定のcnn内の特徴を特定し除去するための専用の抑制手順を導入する。
この抑制手順は単純であることの主な利点を持ち、最新(SOTA)再識別方法を大幅に上回るモデルを生成します。
具体的には、4つの標準人物再識別ベンチマークの実験を行い、SOTAと比較して6.5%mAPまでの絶対性能向上を目撃しています。
関連論文リスト
- Dynamic Perceiver for Efficient Visual Recognition [87.08210214417309]
特徴抽出手順と早期分類タスクを分離する動的知覚器(Dyn-Perceiver)を提案する。
特徴ブランチは画像の特徴を抽出し、分類ブランチは分類タスクに割り当てられた遅延コードを処理する。
早期出口は分類枝に限られており、低レベルの特徴において線形分離性は不要である。
論文 参考訳(メタデータ) (2023-06-20T03:00:22Z) - Unfolding Local Growth Rate Estimates for (Almost) Perfect Adversarial
Detection [22.99930028876662]
畳み込みニューラルネットワーク(CNN)は、多くの知覚的タスクにおける最先端のソリューションを定義する。
現在のCNNアプローチは、システムを騙すために特別に作られた入力の敵の摂動に対して脆弱なままである。
本稿では,ネットワークの局所固有次元(LID)と敵攻撃の関係について,最近の知見を生かした,シンプルで軽量な検出器を提案する。
論文 参考訳(メタデータ) (2022-12-13T17:51:32Z) - Transformer Based Multi-Grained Features for Unsupervised Person
Re-Identification [9.874360118638918]
視覚変換器(ViT)を改良したデュアルブランチネットワークアーキテクチャを構築した。
各ブランチで出力されるローカルトークンをリフォームし、その後一様に複数のストライプに分割して、部分レベルの特徴を生成する。
2つのブランチのグローバルトークンは、グローバル機能を生成するために平均化されます。
論文 参考訳(メタデータ) (2022-11-22T13:51:17Z) - SAR Despeckling Using Overcomplete Convolutional Networks [53.99620005035804]
スペックルはSAR画像を劣化させるため、リモートセンシングにおいて重要な問題である。
近年の研究では、畳み込みニューラルネットワーク(CNN)が古典的解法よりも優れていることが示されている。
本研究は、受容場を制限することで低レベルの特徴を学習することに集中するために、過剰なCNNアーキテクチャを用いる。
本稿では,合成および実SAR画像の非特定化手法と比較して,提案手法により非特定化性能が向上することを示す。
論文 参考訳(メタデータ) (2022-05-31T15:55:37Z) - HAT: Hierarchical Aggregation Transformers for Person Re-identification [87.02828084991062]
我々は,CNNとトランスフォーマーの両方の利点を,高性能な画像ベース人物Re-IDに適用する。
作業は、画像ベースのRe-IDのためのCNNとTransformerの両方の利点を初めて活用する。
論文 参考訳(メタデータ) (2021-07-13T09:34:54Z) - Multi-attentional Deepfake Detection [79.80308897734491]
ディープフェイクによる顔の偽造はインターネットに広まり、深刻な社会的懸念を引き起こしている。
新たなマルチアテンテーショナルディープフェイク検出ネットワークを提案する。
具体的には,1)ネットワークを異なる局所的部分へ配置するための複数の空間的注意ヘッド,2)浅い特徴の微妙なアーティファクトをズームするテクスチャ的特徴拡張ブロック,3)低レベルなテクスチャ特徴と高レベルなセマンティクス特徴をアグリゲートする,の3つの構成要素からなる。
論文 参考訳(メタデータ) (2021-03-03T13:56:14Z) - Hybrid-Attention Guided Network with Multiple Resolution Features for
Person Re-Identification [30.285126447140254]
本稿では,ハイレベルな特徴を学習する際の情報損失を低減するために,ハイレベルな埋め込みと低レベルな埋め込みを融合した新しい人物再IDモデルを提案する。
また,対象物に関するより識別的な特徴を抽出することを目的とした,空間的およびチャネル的注意機構をモデルに導入する。
論文 参考訳(メタデータ) (2020-09-16T08:12:42Z) - Attentive WaveBlock: Complementarity-enhanced Mutual Networks for
Unsupervised Domain Adaptation in Person Re-identification and Beyond [97.25179345878443]
本稿では,新しい軽量モジュールであるAttentive WaveBlock (AWB)を提案する。
AWBは相互学習の二重ネットワークに統合され、相互学習の相補性を高め、擬似ラベルのノイズをさらに抑えることができる。
実験により, 提案手法は, 複数のUDA人物再識別タスクを大幅に改善し, 最先端の性能を達成できることが実証された。
論文 参考訳(メタデータ) (2020-06-11T15:40:40Z) - MagnifierNet: Towards Semantic Adversary and Fusion for Person
Re-identification [38.13515165097505]
MagnifierNetはトリプルブランチネットワークで、詳細を全体から部分まで正確にマイニングする。
「セマンティックフュージョンブランチ」は、意味領域情報を逐次融合することにより、無関係なノイズを除去する。
セマンティック多様性損失」は、学習されたセマンティック表現間で重複する重複を取り除く。
論文 参考訳(メタデータ) (2020-02-25T15:43:46Z) - Diversity-Achieving Slow-DropBlock Network for Person Re-Identification [11.907116133358022]
マルチブランチネットワークアーキテクチャを使用した人物再識別(Re-ID)の大きな課題は、IDラベル付きデータセットから多様な特徴を学習することだ。
BDB(Batch DropBlock)ネットワークは近年,グローバルブランチと機能ドロップブランチの多様性を実現するために提案されている。
提案手法は, Market-1501, DukeMTMC-reID, CUHK03 などの人気人物 Re-ID データセットに対して,BDB よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-02-09T08:05:39Z) - Dense Residual Network: Enhancing Global Dense Feature Flow for
Character Recognition [75.4027660840568]
本稿では,すべての畳み込み層から階層的特徴をフルに活用することにより,局所的・大域的特徴フローを改善する方法について検討する。
技術的には、テキスト認識のための効率的で効果的なCNNフレームワークであるFDRN(Fast Dense Residual Network)を提案する。
論文 参考訳(メタデータ) (2020-01-23T06:55:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。