論文の概要: PS-ARM: An End-to-End Attention-aware Relation Mixer Network for Person
Search
- arxiv url: http://arxiv.org/abs/2210.03433v1
- Date: Fri, 7 Oct 2022 10:04:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-10 14:07:55.535455
- Title: PS-ARM: An End-to-End Attention-aware Relation Mixer Network for Person
Search
- Title(参考訳): PS-ARM: 個人検索のためのエンド・ツー・エンドアテンション・アウェア・リレーション・ミキサーネットワーク
- Authors: Mustansar Fiaz, Hisham Cholakkal, Sanath Narayan, Rao Muhammad Anwer,
and Fahad Shahbaz Khan
- Abstract要約: モジュール・パーソン・サーチのための新しいアテンション・アウェア・リレーション・ミキサー(ARM)を提案する。
私たちのARMモジュールはネイティブで、きめ細かい監督やトポロジカルな仮定に依存していません。
我々のPS-ARMは、両方のデータセットで最先端のパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 56.02761592710612
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Person search is a challenging problem with various real-world applications,
that aims at joint person detection and re-identification of a query person
from uncropped gallery images. Although, the previous study focuses on rich
feature information learning, it is still hard to retrieve the query person due
to the occurrence of appearance deformations and background distractors. In
this paper, we propose a novel attention-aware relation mixer (ARM) module for
person search, which exploits the global relation between different local
regions within RoI of a person and make it robust against various appearance
deformations and occlusion. The proposed ARM is composed of a relation mixer
block and a spatio-channel attention layer. The relation mixer block introduces
a spatially attended spatial mixing and a channel-wise attended channel mixing
for effectively capturing discriminative relation features within an RoI. These
discriminative relation features are further enriched by introducing a
spatio-channel attention where the foreground and background discriminability
is empowered in a joint spatio-channel space. Our ARM module is generic and it
does not rely on fine-grained supervision or topological assumptions, hence
being easily integrated into any Faster R-CNN based person search methods.
Comprehensive experiments are performed on two challenging benchmark datasets:
CUHKSYSU and PRW. Our PS-ARM achieves state-of-the-art performance on both
datasets. On the challenging PRW dataset, our PS-ARM achieves an absolute gain
of 5 in the mAP score over SeqNet, while operating at a comparable speed.
- Abstract(参考訳): 人探索は様々な現実世界のアプリケーションにおいて困難な問題であり、未収集のギャラリー画像からクエリーの発見と再同定を目的としている。
前回の研究はリッチな特徴情報学習に焦点を絞ったものだが,外観の変形や背景の気晴らしの発生などにより,質問者の検索は困難である。
本稿では,人のroi内における異なる局所領域間の大域的な関係を活用し,様々な外観変形や咬合に対して頑健な人物探索用注意認識型リレーショナル・ミキサー(arm)モジュールを提案する。
提案したARMは、リレーションミキサーブロックとスパパチャネルアテンション層から構成される。
関係ミキサブロックは、RoI内の識別関係特徴を効果的にキャプチャする空間的参加空間混合とチャネル的参加チャネル混合を導入する。
これらの判別関係の特徴は、前景と背景判別能力が共用時空間に付与される時空間注意を導入することによりさらに強化される。
我々のARMモジュールは汎用的で、きめ細かい監督やトポロジカルな仮定に依存しないので、より高速なR-CNNベースの人物検索手法に容易に統合できます。
CUHKSYSUとPRWの2つの挑戦的なベンチマークデータセット上で、包括的な実験が行われている。
我々のPS-ARMは、両方のデータセットで最先端のパフォーマンスを達成する。
挑戦的なPRWデータセットでは、私たちのPS-ARMは、SeqNet上でのmAPスコアにおいて、同等の速度で動作しながら、絶対的に5のアップを実現しています。
関連論文リスト
- Robust Collaborative Perception without External Localization and Clock Devices [52.32342059286222]
複数のエージェントをまたいだ一貫した空間的時間的調整は、協調的な知覚の基礎である。
従来の手法は、ローカライゼーションとクロック信号を提供するために外部デバイスに依存している。
本稿では,様々なエージェントの知覚データに内在する幾何学的パターンを認識して整列する手法を提案する。
論文 参考訳(メタデータ) (2024-05-05T15:20:36Z) - Transferring Modality-Aware Pedestrian Attentive Learning for
Visible-Infrared Person Re-identification [43.05147831905626]
本稿では,トランスファーリング・モダリティを意識した歩行者注意学習(TMPA)モデルを提案する。
TMPAは、欠落したモダリティ固有の特徴を効率的に補うために歩行者地域に焦点を当てている。
ベンチマークSYSU-MM01とRegDBデータセットを用いて実験を行い,提案したTMPAモデルの有効性を実証した。
論文 参考訳(メタデータ) (2023-12-12T07:15:17Z) - Learning Cross-modality Information Bottleneck Representation for
Heterogeneous Person Re-Identification [61.49219876388174]
Visible-Infrared person re-identification (VI-ReID)は、インテリジェントビデオ監視において重要かつ困難な課題である。
既存の手法は主に共有特徴空間の学習に重点を置いており、可視光と赤外光の相違を減らす。
本稿では,新しい相互情報・モダリティコンセンサスネットワーク,すなわちCMInfoNetを提案し,モダリティ不変な同一性の特徴を抽出する。
論文 参考訳(メタデータ) (2023-08-29T06:55:42Z) - FGAHOI: Fine-Grained Anchors for Human-Object Interaction Detection [4.534713782093219]
上記の問題を緩和するために、新しいエンドツーエンドトランスフォーマーベースフレームワーク(FGAHOI)を提案する。
FGAHOIは、マルチスケールサンプリング(MSS)、階層空間認識マージ(HSAM)、タスク認識マージ機構(TAM)の3つの専用コンポーネントから構成される。
論文 参考訳(メタデータ) (2023-01-08T03:53:50Z) - Soft Hierarchical Graph Recurrent Networks for Many-Agent Partially
Observable Environments [9.067091068256747]
本稿では,階層型グラフ再帰ネットワーク(HGRN)と呼ばれる新しいネットワーク構造を提案する。
以上の技術に基づいて,Soft-HGRNと呼ばれる値に基づくMADRLアルゴリズムと,SAC-HRGNというアクタクリティカルな変種を提案する。
論文 参考訳(メタデータ) (2021-09-05T09:51:25Z) - Region attention and graph embedding network for occlusion objective
class-based micro-expression recognition [26.5638344747854]
マイクロ圧縮認識(textbfMER)は10年間にわたって多くの研究者の注目を集めてきた。
本稿では,MER,ie,occlusion MERにおける興味深いが未解明の課題を深く研究する。
種々の顔領域間の関係をモデル化するために、アンダーラインRegionにインスパイアされたアンダーラインリレーションアンダーラインネットワーク(textbfRRRN)を提案する。
論文 参考訳(メタデータ) (2021-07-13T08:04:03Z) - Hierarchical Deep CNN Feature Set-Based Representation Learning for
Robust Cross-Resolution Face Recognition [59.29808528182607]
クロスリゾリューション顔認識(CRFR)は、インテリジェントな監視およびバイオメトリックフォレンジックにおいて重要である。
既存の浅層学習と深層学習に基づく手法は、HR-LR対を共同特徴空間にマッピングすることに焦点を当てている。
本研究では,多レベル深層畳み込みニューラルネットワーク(CNN)の機能を完全に活用し,堅牢なCRFRを実現することを目的とする。
論文 参考訳(メタデータ) (2021-03-25T14:03:42Z) - DIRV: Dense Interaction Region Voting for End-to-End Human-Object
Interaction Detection [53.40028068801092]
本稿では,HOI問題に対するインタラクション領域という新しい概念に基づいて,新しい一段階HOI検出手法を提案する。
従来の手法とは異なり,本手法は人-物対ごとに異なるスケールにわたる密集した相互作用領域に焦点をあてる。
単一相互作用領域の検出欠陥を補うために,我々は新しい投票戦略を導入する。
論文 参考訳(メタデータ) (2020-10-02T13:57:58Z) - Landmark Guidance Independent Spatio-channel Attention and Complementary
Context Information based Facial Expression Recognition [5.076419064097734]
現代の顔表情認識(FER)アーキテクチャは、注意を定義するためにランドマーク検出器のような外部ソースに依存している。
本研究では,空間的位置当たりのチャネルごとの局所的および大域的注目度を求める FER のエンドツーエンドアーキテクチャを提案する。
提案したモデルのロバスト性と優れた性能は,組込みデータセットと組込みデータセットの両方で実証される。
論文 参考訳(メタデータ) (2020-07-20T17:33:32Z) - Multi-Granularity Reference-Aided Attentive Feature Aggregation for
Video-based Person Re-identification [98.7585431239291]
ビデオベースの人物再識別は、同じ人物をビデオクリップ間でマッチングすることを目的としている。
本稿では,マルチグラニュラリティ参照属性集約モジュールMG-RAFAを提案する。
本フレームワークは,3つのベンチマークデータセット上での最先端のアブレーション性能を実現する。
論文 参考訳(メタデータ) (2020-03-27T03:49:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。