論文の概要: Multi-Branch with Attention Network for Hand-Based Person Recognition
- arxiv url: http://arxiv.org/abs/2108.02234v1
- Date: Wed, 4 Aug 2021 18:25:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-06 14:43:45.307797
- Title: Multi-Branch with Attention Network for Hand-Based Person Recognition
- Title(参考訳): 手話認識のためのマルチブランチアテンションネットワーク
- Authors: Nathanael L. Baisa, Bryan Williams, Hossein Rahmani, Plamen Angelov,
Sue Black
- Abstract要約: 本稿では,犯罪捜査を目的とした手動人物認識手法を提案する。
提案手法は,マルチブランチ・アテンション・ネットワーク (MBA-Net) で,チャネル・アテンション・モジュールと空間アテンション・モジュールを併用する。
提案手法は,既存の手動識別手法を超越して,最先端の性能を実現する。
- 参考スコア(独自算出の注目度): 5.162308830328819
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a novel hand-based person recognition method for
the purpose of criminal investigations since the hand image is often the only
available information in cases of serious crime such as sexual abuse. Our
proposed method, Multi-Branch with Attention Network (MBA-Net), incorporates
both channel and spatial attention modules in branches in addition to a global
(without attention) branch to capture global structural information for
discriminative feature learning. The attention modules focus on the relevant
features of the hand image while suppressing the irrelevant backgrounds. In
order to overcome the weakness of the attention mechanisms, equivariant to
pixel shuffling, we integrate relative positional encodings into the spatial
attention module to capture the spatial positions of pixels. Extensive
evaluations on two large multi-ethnic and publicly available hand datasets
demonstrate that our proposed method achieves state-of-the-art performance,
surpassing the existing hand-based identification methods.
- Abstract(参考訳): 本稿では,手画像が性的虐待などの重大犯罪の場合にのみ使用可能な情報である場合が多いため,犯罪捜査を目的とした新たな手元人物認識手法を提案する。
提案手法であるMulti-Branch with Attention Network (MBA-Net)は,チャネルと空間の両方の注意モジュールをブランチに組み込んで,グローバルな(注意を払わずに)ブランチを組み込んで,識別的特徴学習のためのグローバルな構造情報を取得する。
注意モジュールは、無関係な背景を抑えながら、手画像の関連する特徴に焦点を当てる。
画素シャッフルと等価なアテンション機構の弱点を克服するため,相対的な位置エンコーディングを空間アテンションモジュールに統合し,画素の空間位置を捉える。
2つの大規模多民族・公用ハンドデータセットの大規模な評価は,提案手法が既存の手による識別手法を超越して,最先端の性能を実現することを示す。
関連論文リスト
- SACANet: scene-aware class attention network for semantic segmentation
of remote sensing images [4.124381172041927]
リモートセンシング画像のセマンティックセグメンテーションのためのシーン認識クラスアテンションネットワーク(SACANet)を提案する。
3つのデータセットの実験結果は、SACANetが他の最先端の手法より優れ、その有効性を検証することを示している。
論文 参考訳(メタデータ) (2023-04-22T14:54:31Z) - Towards Effective Image Manipulation Detection with Proposal Contrastive
Learning [61.5469708038966]
本稿では,効果的な画像操作検出のためのコントラスト学習(PCL)を提案する。
我々のPCLは、RGBとノイズビューから2種類のグローバル特徴を抽出し、2ストリームアーキテクチャで構成されている。
我々のPCLは、実際にラベル付けされていないデータに容易に適用でき、手作業によるラベル付けコストを削減し、より一般化可能な機能を促進することができる。
論文 参考訳(メタデータ) (2022-10-16T13:30:13Z) - Local-Aware Global Attention Network for Person Re-Identification Based on Body and Hand Images [0.0]
本稿では,身体画像と手動画像の両面から,人物Re-Idに対するエンドツーエンドの識別的深層特徴学習のための複合的アプローチを提案する。
提案手法は既存の最先端手法よりも一貫して優れている。
論文 参考訳(メタデータ) (2022-09-11T09:43:42Z) - Multi-Level Attention for Unsupervised Person Re-Identification [9.529435737056179]
教師なしの人物再識別において、多頭自尊心で表される注意モジュールは、非地上真実の条件下での注意の拡散に悩まされる。
画素レベルのアテンションモジュールを設計し,マルチヘッドの自己注意に制約を与える。
個人再識別データの識別対象がすべて歩行者である特性については,ドメインレベルのアテンションモジュールを設計する。
論文 参考訳(メタデータ) (2022-01-10T02:47:06Z) - Alignment Attention by Matching Key and Query Distributions [48.93793773929006]
本稿では,各ヘッダ内のキーとクエリの分布を一致させる自己注意を促すアライメントアテンションアテンションアテンションアテンションアテンションを導入している。
事前学習したモデルを含む自己注意のモデルはすべて、提案したアライメントアテンションアテンションアテンションに変換することが簡単である。
様々な言語理解タスクにおいて, 精度, 不確実性推定, ドメイン間の一般化, 敵攻撃に対する堅牢性などの手法の有効性を示す。
論文 参考訳(メタデータ) (2021-10-25T00:54:57Z) - All the attention you need: Global-local, spatial-channel attention for
image retrieval [11.150896867058902]
大規模インスタンスレベルの画像検索のための表現学習に対処する。
バックボーンネットワークの端に付加されるグローバルローカルアテンションモジュール(GLAM)について述べる。
我々は,特徴テンソルを新たに獲得し,空間プーリングにより画像検索のための強力な埋め込みを学習する。
論文 参考訳(メタデータ) (2021-07-16T16:39:13Z) - Watching You: Global-guided Reciprocal Learning for Video-based Person
Re-identification [82.6971648465279]
映像に基づくRe-IDのための新しいグローバルガイド相互学習フレームワークを提案する。
我々のアプローチは他の最先端のアプローチよりも優れたパフォーマンスを達成できます。
論文 参考訳(メタデータ) (2021-03-07T12:27:42Z) - Hand-Based Person Identification using Global and Part-Aware Deep
Feature Representation Learning [6.144554939661599]
グローバル特徴表現とローカル特徴表現の両方を学習し,手指による人物識別を提案する。
提案手法であるGlobal and Part-Aware Network (GPA-Net) は,conv層上のグローバルおよびローカルブランチを生成する。
提案手法が競合するアプローチを著しく上回っていることを示すため,2つの大規模マルチエスニックデータセットと公開ハンドデータセットについて広範な評価を行った。
論文 参考訳(メタデータ) (2021-01-13T18:47:47Z) - Self-supervised Human Detection and Segmentation via Multi-view
Consensus [116.92405645348185]
本稿では,トレーニング中に幾何学的制約を多視点一貫性という形で組み込むマルチカメラフレームワークを提案する。
本手法は,標準ベンチマークから視覚的に外れた画像に対して,最先端の自己監視的人物検出とセグメンテーション技術に勝ることを示す。
論文 参考訳(メタデータ) (2020-12-09T15:47:21Z) - Rethinking of the Image Salient Object Detection: Object-level Semantic
Saliency Re-ranking First, Pixel-wise Saliency Refinement Latter [62.26677215668959]
本稿では,意味的に有意な領域を粗い位置で特定する,軽量で教師付きの深層ネットワークを提案する。
次に,これらセマンティック・サリエント領域の深層モデルを画素ワイド・サリエンシ改善として融合する。
提案手法は単純だが有効であり,本手法は主眼をオブジェクトレベルのセマンティック・リグレード問題とみなすための最初の試みである。
論文 参考訳(メタデータ) (2020-08-10T07:12:43Z) - Ventral-Dorsal Neural Networks: Object Detection via Selective Attention [51.79577908317031]
我々はVDNet(Ventral-Dorsal Networks)と呼ばれる新しいフレームワークを提案する。
人間の視覚システムの構造にインスパイアされた我々は「Ventral Network」と「Dorsal Network」の統合を提案する。
実験の結果,提案手法は最先端の物体検出手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-05-15T23:57:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。