論文の概要: ViFi-ReID: A Two-Stream Vision-WiFi Multimodal Approach for Person Re-identification
- arxiv url: http://arxiv.org/abs/2410.09875v1
- Date: Sun, 13 Oct 2024 15:34:11 GMT
- ステータス: 処理完了
- システム内更新日: 2024-10-30 04:23:08.577353
- Title: ViFi-ReID: A Two-Stream Vision-WiFi Multimodal Approach for Person Re-identification
- Title(参考訳): ViFi-ReID: 人物再識別のための2ストリームビジョン-Wi-Fiマルチモーダルアプローチ
- Authors: Chen Mao, Chong Tan, Jingqi Hu, Min Zheng,
- Abstract要約: 人物再識別(ReID)は、安全検査、人員計数などにおいて重要な役割を担っている。
現在のReIDアプローチのほとんどは、主に目的条件の影響を受けやすい画像から特徴を抽出する。
我々は、Wi-Fi信号のチャネル状態情報(CSI)を介して歩行者からの歩行情報をキャプチャすることで、広く利用可能なルータをセンサデバイスとして活用する。
- 参考スコア(独自算出の注目度): 3.3743041904085125
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Person re-identification(ReID), as a crucial technology in the field of security, plays a vital role in safety inspections, personnel counting, and more. Most current ReID approaches primarily extract features from images, which are easily affected by objective conditions such as clothing changes and occlusions. In addition to cameras, we leverage widely available routers as sensing devices by capturing gait information from pedestrians through the Channel State Information (CSI) in WiFi signals and contribute a multimodal dataset. We employ a two-stream network to separately process video understanding and signal analysis tasks, and conduct multi-modal fusion and contrastive learning on pedestrian video and WiFi data. Extensive experiments in real-world scenarios demonstrate that our method effectively uncovers the correlations between heterogeneous data, bridges the gap between visual and signal modalities, significantly expands the sensing range, and improves ReID accuracy across multiple sensors.
- Abstract(参考訳): セキュリティ分野において重要な技術である人物再識別(ReID)は、安全検査、人員数えなどにおいて重要な役割を担っている。
現在のReIDアプローチのほとんどは、主に、衣服の変化や閉塞といった客観的な条件の影響を受けやすい画像から特徴を抽出する。
カメラに加えて、WiFi信号のチャネル状態情報(CSI)を介して歩行者からの歩行情報を捕捉し、マルチモーダルデータセットに寄与することにより、広く利用可能なルータをセンサデバイスとして活用する。
我々は,映像理解と信号解析のタスクを別々に処理し,歩行者映像とWiFiデータに対するマルチモーダル融合とコントラスト学習を行うために2ストリームネットワークを採用している。
実世界のシナリオにおける大規模な実験により, 異種データ間の相関関係を効果的に解明し, 視覚と信号の相違を橋渡しし, 感知範囲を大幅に拡大し, 複数センサ間のReID精度を向上することを示した。
関連論文リスト
- Time-Frequency Analysis of Variable-Length WiFi CSI Signals for Person Re-Identification [3.3743041904085125]
人物再識別(ReID)は、セキュリティ検出や数え方において重要な役割を果たす。
本文では, 歩行者の特徴を識別するための基礎として, WiFi信号のマルチパス伝搬特性を活用する, WiFiチャネル状態情報(CSI)を用いた手法を紹介する。
本稿では、WiFi信号の周波数領域における時間領域の振幅と位相を解析し、可変長データを処理できる2ストリームネットワーク構造を提案する。
論文 参考訳(メタデータ) (2024-07-12T07:10:47Z) - LCPR: A Multi-Scale Attention-Based LiDAR-Camera Fusion Network for
Place Recognition [11.206532393178385]
本稿では,マルチモーダル位置認識のための新しいニューラルネットワークLCPRを提案する。
位置認識性能を向上させるために,マルチビューカメラとLiDARデータを効果的に利用することができる。
論文 参考訳(メタデータ) (2023-11-06T15:39:48Z) - GaitFi: Robust Device-Free Human Identification via WiFi and Vision
Multimodal Learning [33.89340087471202]
本稿では,WiFi信号とビデオを利用したマルチモーダル歩行認識手法GaitFiを提案する。
GaitFiでは、WiFiのマルチパス伝搬を反映したチャネル状態情報(CSI)が収集され、人間の視線を捉え、ビデオはカメラによってキャプチャされる。
本稿では,ロバストな歩行情報を学習するために,バックボーンネットワークとして軽量残差畳み込みネットワーク(LRCN)を提案し,さらに2ストリームのGaitFiを提案する。
GaitFiが最先端の歩行認識より優れていることを示す実験が実世界で実施されている
論文 参考訳(メタデータ) (2022-08-30T15:07:43Z) - Self-Supervised Multimodal Fusion Transformer for Passive Activity
Recognition [2.35066982314539]
Wi-Fi信号は、医療などの分野において、人間の知覚と活動認識に重要な機会を提供する。
現在のシステムでは、複数のセンサーから取得した情報を効果的に利用して、異なるアクティビティを認識することはできない。
本稿では,マルチモーダル・マルチセンサ融合のための注意モデルであるFusion Transformerを提案する。
論文 参考訳(メタデータ) (2022-08-15T15:38:10Z) - A Wireless-Vision Dataset for Privacy Preserving Human Activity
Recognition [53.41825941088989]
アクティビティ認識の堅牢性を改善するため,WiNN(WiFi-based and video-based neural network)が提案されている。
以上の結果から,WiViデータセットは一次需要を満足し,パイプライン内の3つのブランチはすべて,80%以上のアクティビティ認識精度を維持していることがわかった。
論文 参考訳(メタデータ) (2022-05-24T10:49:11Z) - Target-aware Dual Adversarial Learning and a Multi-scenario
Multi-Modality Benchmark to Fuse Infrared and Visible for Object Detection [65.30079184700755]
本研究は、物体検出のために異なるように見える赤外線と可視画像の融合の問題に対処する。
従来のアプローチでは、2つのモダリティの根底にある共通点を発見し、反復最適化またはディープネットワークによって共通空間に融合する。
本稿では、融合と検出の連立問題に対する二段階最適化の定式化を提案し、その後、核融合と一般的に使用される検出ネットワークのためのターゲット認識デュアル逆学習(TarDAL)ネットワークに展開する。
論文 参考訳(メタデータ) (2022-03-30T11:44:56Z) - Robust Semi-supervised Federated Learning for Images Automatic
Recognition in Internet of Drones [57.468730437381076]
プライバシー保護型UAV画像認識のための半教師付きフェデレートラーニング(SSFL)フレームワークを提案する。
異なるカメラモジュールを使用したUAVによって収集されたローカルデータの数、特徴、分布には大きな違いがある。
本稿では,クライアントがトレーニングに参加する頻度,すなわちFedFreqアグリゲーションルールに基づくアグリゲーションルールを提案する。
論文 参考訳(メタデータ) (2022-01-03T16:49:33Z) - Unsupervised Person Re-Identification with Wireless Positioning under
Weak Scene Labeling [131.18390399368997]
本稿では、弱いシーンラベリングの下で、視覚データと無線位置決めトラジェクトリの両方を用いて、教師なしの人物再識別を探索することを提案する。
具体的には、視覚データと無線情報の相補性をモデル化した、新しい教師なしマルチモーダルトレーニングフレームワーク(UMTF)を提案する。
我々のUMTFには、MMDA(Multimodal Data Association Strategy)とMMGN(Multimodal Graph Neural Network)が含まれている。
論文 参考訳(メタデータ) (2021-10-29T08:25:44Z) - Semantics-aware Adaptive Knowledge Distillation for Sensor-to-Vision
Action Recognition [131.6328804788164]
本稿では,視覚・センサ・モダリティ(動画)における行動認識を強化するためのフレームワーク,Semantics-Aware Adaptive Knowledge Distillation Networks (SAKDN)を提案する。
SAKDNは複数のウェアラブルセンサーを教師のモダリティとして使用し、RGB動画を学生のモダリティとして使用している。
論文 参考訳(メタデータ) (2020-09-01T03:38:31Z) - Vision Meets Wireless Positioning: Effective Person Re-identification
with Recurrent Context Propagation [120.18969251405485]
既存の人物再識別方法は、歩行者を捕獲する視覚センサーに依存している。
携帯電話は、無線測位信号の形で、WiFiや携帯電話ネットワークによって感知することができる。
本稿では,視覚データと無線位置決めデータの間で情報伝達を可能にする新しいコンテキスト伝搬モジュールを提案する。
論文 参考訳(メタデータ) (2020-08-10T14:19:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。