論文の概要: Unsupervised Person Re-Identification with Wireless Positioning under
Weak Scene Labeling
- arxiv url: http://arxiv.org/abs/2110.15610v2
- Date: Wed, 5 Apr 2023 11:07:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-06 16:43:12.351149
- Title: Unsupervised Person Re-Identification with Wireless Positioning under
Weak Scene Labeling
- Title(参考訳): 弱映像ラベリングにおける無線位置定位による教師なし人物再同定
- Authors: Yiheng Liu, Wengang Zhou, Qiaokang Xie, Houqiang Li
- Abstract要約: 本稿では、弱いシーンラベリングの下で、視覚データと無線位置決めトラジェクトリの両方を用いて、教師なしの人物再識別を探索することを提案する。
具体的には、視覚データと無線情報の相補性をモデル化した、新しい教師なしマルチモーダルトレーニングフレームワーク(UMTF)を提案する。
我々のUMTFには、MMDA(Multimodal Data Association Strategy)とMMGN(Multimodal Graph Neural Network)が含まれている。
- 参考スコア(独自算出の注目度): 131.18390399368997
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing unsupervised person re-identification methods only rely on visual
clues to match pedestrians under different cameras. Since visual data is
essentially susceptible to occlusion, blur, clothing changes, etc., a promising
solution is to introduce heterogeneous data to make up for the defect of visual
data. Some works based on full-scene labeling introduce wireless positioning to
assist cross-domain person re-identification, but their GPS labeling of entire
monitoring scenes is laborious. To this end, we propose to explore unsupervised
person re-identification with both visual data and wireless positioning
trajectories under weak scene labeling, in which we only need to know the
locations of the cameras. Specifically, we propose a novel unsupervised
multimodal training framework (UMTF), which models the complementarity of
visual data and wireless information. Our UMTF contains a multimodal data
association strategy (MMDA) and a multimodal graph neural network (MMGN). MMDA
explores potential data associations in unlabeled multimodal data, while MMGN
propagates multimodal messages in the video graph based on the adjacency matrix
learned from histogram statistics of wireless data. Thanks to the robustness of
the wireless data to visual noise and the collaboration of various modules,
UMTF is capable of learning a model free of the human label on data. Extensive
experimental results conducted on two challenging datasets, i.e., WP-ReID and
DukeMTMC-VideoReID demonstrate the effectiveness of the proposed method.
- Abstract(参考訳): 既存の監視されていない人物の身元確認方法は、異なるカメラの下で歩行者にマッチする視覚的手がかりにのみ依存する。
視覚データは基本的に閉塞、ぼけ、衣料変化などに影響を受けやすいため、視覚データの欠陥を補うために異種データを導入することが有望な解決策となる。
フルシーンラベリングに基づくいくつかの作品では、クロスドメインの人物の再識別を支援するために無線位置決めを導入している。
そこで本研究では,映像データと無線測位トラジェクタの両方を用いて,カメラの位置を知るだけでよい,弱いシーンラベリング下での教師なし人物再同定について検討する。
具体的には,視覚データと無線情報の相補性をモデル化する,教師なしマルチモーダルトレーニングフレームワーク (umtf) を提案する。
UMTFにはマルチモーダルデータアソシエーション戦略(MMDA)とマルチモーダルグラフニューラルネットワーク(MMGN)が含まれている。
mmdaはラベルのないマルチモーダルデータにおける潜在的なデータ関連を調査し、mmgnは無線データのヒストグラム統計から得られた隣接行列に基づいてビデオグラフ内のマルチモーダルメッセージを伝搬する。
無線データから視覚ノイズへの堅牢性、および様々なモジュールの協調により、UMTFは人間のラベルのないモデルをデータで学習することができる。
WP-ReIDとDukeMTMC-VideoReIDの2つの挑戦的データセットで行った実験結果から,提案手法の有効性が示された。
関連論文リスト
- Few-shot Message-Enhanced Contrastive Learning for Graph Anomaly
Detection [15.757864894708364]
グラフ異常検出は、多数派から大きく逸脱するグラフデータの例外的なインスタンスを特定する上で重要な役割を果たす。
我々はFMGADと呼ばれる新しい数ショットグラフ異常検出モデルを提案する。
FMGADは, 人工的に注入された異常やドメイン・有機異常によらず, 他の最先端手法よりも優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2023-11-17T07:49:20Z) - ADAMM: Anomaly Detection of Attributed Multi-graphs with Metadata: A
Unified Neural Network Approach [39.211176955683285]
有向多重グラフを処理する新しいグラフニューラルネットワークモデルADAMMを提案する。
ADAMMは、教師なしの異常検出目的を通じてメタデータとグラフレベルの表現学習を融合する。
論文 参考訳(メタデータ) (2023-11-13T14:19:36Z) - MMRDN: Consistent Representation for Multi-View Manipulation
Relationship Detection in Object-Stacked Scenes [62.20046129613934]
我々は,MMRDN(Multi-view MRD Network)と呼ばれる新しい多視点融合フレームワークを提案する。
異なるビューからの2Dデータを共通の隠れ空間に投影し、埋め込みをVon-Mises-Fisher分布に適合させる。
これら2つのオブジェクトの相対位置を符号化した各オブジェクト対の点雲から、K$最大垂直近傍点(KMVN)の集合を選択する。
論文 参考訳(メタデータ) (2023-04-25T05:55:29Z) - Unified Visual Relationship Detection with Vision and Language Models [89.77838890788638]
この研究は、複数のデータセットからラベル空間の結合を予測する単一の視覚的関係検出器のトレーニングに焦点を当てている。
視覚と言語モデルを活用した統合視覚関係検出のための新しいボトムアップ手法UniVRDを提案する。
人物体間相互作用検出とシーングラフ生成の双方による実験結果から,本モデルの競合性能が示された。
論文 参考訳(メタデータ) (2023-03-16T00:06:28Z) - ViFiCon: Vision and Wireless Association Via Self-Supervised Contrastive
Learning [5.5232283752707785]
ViFiCon(バイフィコン)は、視覚と無線のモダリティをまたいだ同期情報を用いて、相互接続を行う自己教師型コントラスト学習方式である。
本稿では,ViFiConが高性能なビジョン・ツー・ワイヤレス・アソシエーションを実現し,どのバウンディングボックスがどのスマートフォンデバイスに対応するかを示す。
論文 参考訳(メタデータ) (2022-10-11T15:04:05Z) - From Unsupervised to Few-shot Graph Anomaly Detection: A Multi-scale Contrastive Learning Approach [26.973056364587766]
グラフデータからの異常検出は、ソーシャルネットワーク、金融、eコマースなど、多くのアプリケーションにおいて重要なデータマイニングタスクである。
マルチスケールcONtrastive lEarning(略してANEMONE)を用いた新しいフレームワーク, graph Anomaly dEtection フレームワークを提案する。
グラフニューラルネットワークをバックボーンとして、複数のグラフスケール(ビュー)から情報をエンコードすることで、グラフ内のノードのより良い表現を学習する。
論文 参考訳(メタデータ) (2022-02-11T09:45:11Z) - Unsupervised Domain Adaptive Learning via Synthetic Data for Person
Re-identification [101.1886788396803]
人物再識別(re-ID)は、ビデオ監視に広く応用されているため、ますます注目を集めている。
残念なことに、主流のディープラーニング手法では、モデルをトレーニングするために大量のラベル付きデータが必要です。
本稿では,コンピュータゲーム内で合成されたre-IDサンプルを自動的に生成するデータコレクタを開発し,同時にアノテートするデータラベラを構築した。
論文 参考訳(メタデータ) (2021-09-12T15:51:41Z) - Visual Distant Supervision for Scene Graph Generation [66.10579690929623]
シーングラフモデルは通常、大量のラベル付きデータを人間のアノテーションで教師付き学習する必要がある。
本研究では,人間ラベルデータを用いずにシーングラフモデルを訓練できる視覚関係学習の新しいパラダイムである視覚遠方監視を提案する。
包括的な実験結果から、我々の遠隔監視モデルは、弱い監督と半監督のベースラインよりも優れています。
論文 参考訳(メタデータ) (2021-03-29T06:35:24Z) - Vision Meets Wireless Positioning: Effective Person Re-identification
with Recurrent Context Propagation [120.18969251405485]
既存の人物再識別方法は、歩行者を捕獲する視覚センサーに依存している。
携帯電話は、無線測位信号の形で、WiFiや携帯電話ネットワークによって感知することができる。
本稿では,視覚データと無線位置決めデータの間で情報伝達を可能にする新しいコンテキスト伝搬モジュールを提案する。
論文 参考訳(メタデータ) (2020-08-10T14:19:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。