論文の概要: Spectrum-guided Feature Enhancement Network for Event Person
Re-Identification
- arxiv url: http://arxiv.org/abs/2402.01269v1
- Date: Fri, 2 Feb 2024 09:47:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-05 16:03:26.931757
- Title: Spectrum-guided Feature Enhancement Network for Event Person
Re-Identification
- Title(参考訳): イベントパーソン再識別のためのスペクトル誘導特徴強調ネットワーク
- Authors: Hongchen Tan, Yi Zhang, Xiuping Liu, Baocai Yin, Nan Ma, Xin Li,
Huchuan Lu
- Abstract要約: スペクトル誘導型特徴拡張ネットワーク(SFE-Net)について紹介する。
SFE-Netは、Multi-grain Spectrum Attention Mechanism (MSAM)とConsecutive Patch Dropout Module (CPDM)の2つの革新的なコンポーネントで構成されている。
- 参考スコア(独自算出の注目度): 82.52960675574353
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As a cutting-edge biosensor, the event camera holds significant potential in
the field of computer vision, particularly regarding privacy preservation.
However, compared to traditional cameras, event streams often contain noise and
possess extremely sparse semantics, posing a formidable challenge for
event-based person re-identification (event Re-ID). To address this, we
introduce a novel event person re-identification network: the Spectrum-guided
Feature Enhancement Network (SFE-Net). This network consists of two innovative
components: the Multi-grain Spectrum Attention Mechanism (MSAM) and the
Consecutive Patch Dropout Module (CPDM). MSAM employs a fourier spectrum
transform strategy to filter event noise, while also utilizing an event-guided
multi-granularity attention strategy to enhance and capture discriminative
person semantics. CPDM employs a consecutive patch dropout strategy to generate
multiple incomplete feature maps, encouraging the deep Re-ID model to equally
perceive each effective region of the person's body and capture robust person
descriptors. Extensive experiments on Event Re-ID datasets demonstrate that our
SFE-Net achieves the best performance in this task.
- Abstract(参考訳): 最先端バイオセンサーとして、イベントカメラはコンピュータビジョン、特にプライバシー保護の分野で大きな可能性を秘めている。
しかし、従来のカメラと比較して、イベントストリームはノイズを伴い、非常にスパースなセマンティクスを持ち、イベントベースの人物の再識別(イベントRe-ID)に深刻な課題を呈する。
そこで我々は,新しい人物識別ネットワークであるスペクトル誘導特徴強調ネットワーク(SFE-Net)を紹介した。
このネットワークは、2つの革新的なコンポーネント、MSAM(Multi-grain Spectrum Attention Mechanism)とCPDM(Consecutive Patch Dropout Module)で構成されている。
MSAMは、イベントノイズをフィルタリングするためにフーリエスペクトル変換戦略を使用し、また、イベント誘導多粒度注意戦略を利用して、識別的人物意味論を強化し、捉える。
CPDMは、複数の不完全な特徴マップを生成するために、連続的なパッチドロップアウト戦略を採用しており、ディープ Re-IDモデルは、人の身体の各有効領域を等しく知覚し、堅牢な人物記述子を捕獲することを奨励している。
Event Re-IDデータセットに関する大規模な実験は、私たちのSFE-Netがこのタスクで最高のパフォーマンスを達成することを示す。
関連論文リスト
- FE-UNet: Frequency Domain Enhanced U-Net with Segment Anything Capability for Versatile Image Segmentation [50.9040167152168]
CNNのコントラスト感度関数を実験的に定量化し,人間の視覚システムと比較した。
本稿ではウェーブレット誘導分光ポーリングモジュール(WSPM)を提案する。
人間の視覚系をさらにエミュレートするために、周波数領域拡張受容野ブロック(FE-RFB)を導入する。
本研究では,SAM2 をバックボーンとし,Hiera-Large を事前学習ブロックとして組み込んだ FE-UNet を開発した。
論文 参考訳(メタデータ) (2025-02-06T07:24:34Z) - Cross-Modal Synergies: Unveiling the Potential of Motion-Aware Fusion Networks in Handling Dynamic and Static ReID Scenarios [4.635813517641097]
本稿では,静的画像から得られる動きキューを利用してReID機能を大幅に向上させる,新しいMotion-Aware Fusion (MOTAR-FUSE) ネットワークを提案する。
我々のアプローチのユニークな側面は、モーション・アウェア・トランスフォーマーが人間の動きのダイナミクスを正確に捉えることができるような、動きの整合性タスクの統合である。
論文 参考訳(メタデータ) (2025-02-02T04:37:25Z) - Semi-supervised Semantic Segmentation for Remote Sensing Images via Multi-scale Uncertainty Consistency and Cross-Teacher-Student Attention [59.19580789952102]
本稿では,RS画像セマンティックセグメンテーションタスクのための,新しい半教師付きマルチスケール不確かさとクロスTeacher-Student Attention(MUCA)モデルを提案する。
MUCAは、マルチスケールの不確実性整合正則化を導入することにより、ネットワークの異なる層における特徴写像間の整合性を制限する。
MUCAは学生ネットワークの誘導にクロス教師・学生の注意機構を使用し、学生ネットワークにより差別的な特徴表現を構築するよう誘導する。
論文 参考訳(メタデータ) (2025-01-18T11:57:20Z) - ViFi-ReID: A Two-Stream Vision-WiFi Multimodal Approach for Person Re-identification [3.3743041904085125]
人物再識別(ReID)は、安全検査、人員計数などにおいて重要な役割を担っている。
現在のReIDアプローチのほとんどは、主に目的条件の影響を受けやすい画像から特徴を抽出する。
我々は、Wi-Fi信号のチャネル状態情報(CSI)を介して歩行者からの歩行情報をキャプチャすることで、広く利用可能なルータをセンサデバイスとして活用する。
論文 参考訳(メタデータ) (2024-10-13T15:34:11Z) - PartFormer: Awakening Latent Diverse Representation from Vision Transformer for Object Re-Identification [73.64560354556498]
Vision Transformer (ViT) は、ほとんどの異なる訓練データ領域に過度に適合する傾向にあり、その一般化性と全体的対象特徴への注意が制限される。
本稿では、オブジェクトRe-IDタスクの制限を克服するために設計された、ViTの革新的な適応であるPartFormerを紹介する。
我々のフレームワークは、最も困難なMSMT17データセットにおいて、最先端の2.4%のmAPスコアを著しく上回る。
論文 参考訳(メタデータ) (2024-08-29T16:31:05Z) - SpikeMOT: Event-based Multi-Object Tracking with Sparse Motion Features [52.213656737672935]
SpikeMOTはイベントベースのマルチオブジェクトトラッカーである。
SpikeMOTはスパイクニューラルネットワークを使用して、オブジェクトに関連するイベントストリームからスパーステンポラルな特徴を抽出する。
論文 参考訳(メタデータ) (2023-09-29T05:13:43Z) - Feature Disentanglement Learning with Switching and Aggregation for
Video-based Person Re-Identification [9.068045610800667]
映像人物再識別(Re-ID)では、連続したフレームから対象人物の特徴を一貫して抽出する必要がある。
既存の手法は時間的情報の使用方法にのみ焦点をあてる傾向があり、しばしばネットワークは同じような外観と同じ背景に騙される。
本稿では,DSANet(Disentanglement and Switching and Aggregation Network)を提案する。
論文 参考訳(メタデータ) (2022-12-16T04:27:56Z) - Specificity-preserving RGB-D Saliency Detection [103.3722116992476]
本稿では,RGB-Dサリエンシ検出のための特異性保存ネットワーク(SP-Net)を提案する。
2つのモダリティ特化ネットワークと共有学習ネットワークを採用し、個別および共有唾液マップを生成する。
6つのベンチマークデータセットの実験では、SP-Netは他の最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2021-08-18T14:14:22Z) - Semantic Consistency and Identity Mapping Multi-Component Generative
Adversarial Network for Person Re-Identification [39.605062525247135]
本稿では,1つのドメインから複数のドメインへのスタイル適応を提供する,意味一貫性とアイデンティティマッピングの多成分生成対向ネットワーク(SC-IMGAN)を提案する。
提案手法は,6つの挑戦的人物リidデータセットにおける最先端技術よりも優れている。
論文 参考訳(メタデータ) (2021-04-28T14:12:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。