論文の概要: Cross-Correlated Attention Networks for Person Re-Identification
- arxiv url: http://arxiv.org/abs/2006.09597v1
- Date: Wed, 17 Jun 2020 01:47:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-19 20:52:57.308208
- Title: Cross-Correlated Attention Networks for Person Re-Identification
- Title(参考訳): 人物再識別のためのクロスコラーレントアテンションネットワーク
- Authors: Jieming Zhou, Soumava Kumar Roy, Pengfei Fang, Mehrtash Harandi, Lars
Petersson
- Abstract要約: 我々はCCA(Cross-Correlated Attention)と呼ばれる新しいアテンションモジュールを提案する。
CCAは、参加する異なる地域間での情報ゲインを最大化することで、そのような制限を克服することを目指している。
また,人物画像の頑健かつ識別的な表現を学習するために,異なる注意機構を利用する新しいディープネットワークを提案する。
- 参考スコア(独自算出の注目度): 34.84287025161801
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep neural networks need to make robust inference in the presence of
occlusion, background clutter, pose and viewpoint variations -- to name a few
-- when the task of person re-identification is considered. Attention
mechanisms have recently proven to be successful in handling the aforementioned
challenges to some degree. However previous designs fail to capture inherent
inter-dependencies between the attended features; leading to restricted
interactions between the attention blocks. In this paper, we propose a new
attention module called Cross-Correlated Attention (CCA); which aims to
overcome such limitations by maximizing the information gain between different
attended regions. Moreover, we also propose a novel deep network that makes use
of different attention mechanisms to learn robust and discriminative
representations of person images. The resulting model is called the
Cross-Correlated Attention Network (CCAN). Extensive experiments demonstrate
that the CCAN comfortably outperforms current state-of-the-art algorithms by a
tangible margin.
- Abstract(参考訳): 深層ニューラルネットワークは、人物再同定のタスクが考慮されている場合、オクルージョン、背景クラッタ、ポーズ、視点のバリエーションの存在下でロバストな推論を行う必要がある。
注意機構は、最近、上記の課題をある程度処理することに成功している。
しかし、以前の設計では、出席する機能間の依存性をキャプチャできず、アテンションブロック間の相互作用が制限された。
本稿では,参加地域間の情報利得を最大化することにより,その制限を克服することを目的とした,相互関連注意(cca)と呼ばれる新しい注意モジュールを提案する。
さらに,人物画像のロバスト表現と識別表現を学習するために,異なる注意機構を利用する新しい深層ネットワークを提案する。
得られたモデルはCross-Correlated Attention Network (CCAN)と呼ばれる。
大規模な実験により、CCANは目に見えるマージンで現在の最先端のアルゴリズムより快適に優れていることが示された。
関連論文リスト
- Attention Overlap Is Responsible for The Entity Missing Problem in Text-to-image Diffusion Models! [3.355491272942994]
本研究では, 実体欠落問題の原因となる3つの要因について検討し, クロスアテンションダイナミクスに着目した。
実体間の注意マップの重複を減らすことは、実体の欠落率を効果的に最小化することを発見した。
論文 参考訳(メタデータ) (2024-10-28T12:43:48Z) - Learning to ignore: rethinking attention in CNNs [87.01305532842878]
我々は,CNNの注意機構を再構築し,出席する学習ではなく無視することを学ぶことを提案する。
具体的には、シーン内で無関係な情報を明示的に学習し、生成した表現でそれを抑えることを提案する。
論文 参考訳(メタデータ) (2021-11-10T13:47:37Z) - Alignment Attention by Matching Key and Query Distributions [48.93793773929006]
本稿では,各ヘッダ内のキーとクエリの分布を一致させる自己注意を促すアライメントアテンションアテンションアテンションアテンションアテンションを導入している。
事前学習したモデルを含む自己注意のモデルはすべて、提案したアライメントアテンションアテンションアテンションに変換することが簡単である。
様々な言語理解タスクにおいて, 精度, 不確実性推定, ドメイン間の一般化, 敵攻撃に対する堅牢性などの手法の有効性を示す。
論文 参考訳(メタデータ) (2021-10-25T00:54:57Z) - Bayesian Attention Belief Networks [59.183311769616466]
注意に基づくニューラルネットワークは、幅広いタスクにおいて最先端の結果を得た。
本稿では,非正規化注意重みをモデル化してデコーダネットワークを構築するベイズ的注意信念ネットワークについて紹介する。
提案手法は, 精度, 不確実性推定, ドメイン間の一般化, 敵攻撃において, 決定論的注意と最先端の注意よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-06-09T17:46:22Z) - More Than Just Attention: Learning Cross-Modal Attentions with
Contrastive Constraints [63.08768589044052]
本稿では,コントラストコンテンツリソーシング (CCR) とコントラストコンテンツスワッピング (CCS) の制約を提案する。
CCRとCCSの制約は、明示的な注意アノテーションを必要とせず、対照的な学習方法で注意モデルのトレーニングを監督する。
Flickr30kとMS-COCOのデータセットの実験は、これらの注意制約を2つの最先端の注意ベースモデルに統合することで、モデルのパフォーマンスが向上することを示した。
論文 参考訳(メタデータ) (2021-05-20T08:48:10Z) - Learning Interpretable Models for Coupled Networks Under Domain
Constraints [8.308385006727702]
脳ネットワークの構造的エッジと機能的エッジの相互作用に着目して,結合ネットワークの概念を検討する。
相互作用を推定しながらノイズ項にハードネットワークの制約を課す新しい定式化を提案する。
ヒトコネクトームプロジェクトから得られたマルチシェル拡散およびタスク誘発fMRIデータセットの手法を検証する。
論文 参考訳(メタデータ) (2021-04-19T06:23:31Z) - Robust Facial Landmark Detection by Cross-order Cross-semantic Deep
Network [58.843211405385205]
顔のランドマーク検出を堅牢にするためのセマンティックな特徴学習を促進するために,クロスオーダー・クロスセマンティック・ディープ・ネットワーク(CCDN)を提案する。
具体的には、より識別的な表現学習のためのクロスオーダーチャネル相関を導入するために、クロスオーダー2列マルチ励起(CTM)モジュールを提案する。
新しいクロス・オーダー・クロス・セマンティック・レギュレータ (COCS) は、顔のランドマーク検出のために異なるアクティベーションからクロス・オーダーのクロス・セマンティック特徴を学習するためにネットワークを駆動するように設計されている。
論文 参考訳(メタデータ) (2020-11-16T08:19:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。