論文の概要: Learning Multi-Granular Hypergraphs for Video-Based Person
Re-Identification
- arxiv url: http://arxiv.org/abs/2104.14913v1
- Date: Fri, 30 Apr 2021 11:20:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-03 13:38:16.278834
- Title: Learning Multi-Granular Hypergraphs for Video-Based Person
Re-Identification
- Title(参考訳): 映像に基づく人物再同定のためのマルチグラニュラーハイパーグラフの学習
- Authors: Yichao Yan, Jie Qin1, Jiaxin Chen, Li Liu, Fan Zhu, Ying Tai, Ling
Shao
- Abstract要約: ビデオベースの人物識別(re-ID)はコンピュータビジョンにおいて重要な研究課題である。
MGH(Multi-Granular Hypergraph)という新しいグラフベースのフレームワークを提案する。
MARSの90.0%のトップ-1精度はMGHを用いて達成され、最先端のスキームよりも優れていた。
- 参考スコア(独自算出の注目度): 110.52328716130022
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Video-based person re-identification (re-ID) is an important research topic
in computer vision. The key to tackling the challenging task is to exploit both
spatial and temporal clues in video sequences. In this work, we propose a novel
graph-based framework, namely Multi-Granular Hypergraph (MGH), to pursue better
representational capabilities by modeling spatiotemporal dependencies in terms
of multiple granularities. Specifically, hypergraphs with different spatial
granularities are constructed using various levels of part-based features
across the video sequence. In each hypergraph, different temporal granularities
are captured by hyperedges that connect a set of graph nodes (i.e., part-based
features) across different temporal ranges. Two critical issues (misalignment
and occlusion) are explicitly addressed by the proposed hypergraph propagation
and feature aggregation schemes. Finally, we further enhance the overall video
representation by learning more diversified graph-level representations of
multiple granularities based on mutual information minimization. Extensive
experiments on three widely adopted benchmarks clearly demonstrate the
effectiveness of the proposed framework. Notably, 90.0% top-1 accuracy on MARS
is achieved using MGH, outperforming the state-of-the-arts. Code is available
at https://github.com/daodaofr/hypergraph_reid.
- Abstract(参考訳): ビデオベースの人物識別(re-ID)はコンピュータビジョンにおいて重要な研究課題である。
難しいタスクに取り組むための鍵は、ビデオシーケンスで時間的手がかりと時間的手がかりの両方を利用することです。
本研究では,複数粒度の時空間依存性をモデル化することにより,より優れた表現能力を追求するためのグラフベースの新しいフレームワーク,MGHを提案する。
具体的には, 空間的粒度の異なるハイパーグラフを, ビデオシーケンス全体にわたる様々な部分的特徴を用いて構築する。
それぞれのハイパーグラフにおいて、異なる時間的粒度は、異なる時間的範囲にわたってグラフノードの集合(すなわち部分的特徴)を接続するハイパーエッジによってキャプチャされる。
2つの重要な問題(ミスアライメントとオクルージョン)は、提案されたハイパーグラフ伝搬と特徴集約スキームによって明確に解決される。
最後に、相互情報最小化に基づいて、複数の粒度のより多様化したグラフレベル表現を学習することにより、映像全体の表現をさらに強化する。
広く採用されている3つのベンチマークに関する広範囲な実験は、提案フレームワークの有効性を明確に示している。
特に、MARS上の90.0%のトップ-1精度はMGHを用いて達成され、最先端技術よりも優れている。
コードはhttps://github.com/daodaofr/hypergraph_reidで入手できる。
関連論文リスト
- Hypergraph Transformer for Semi-Supervised Classification [50.92027313775934]
我々は新しいハイパーグラフ学習フレームワークHyperGraph Transformer(HyperGT)を提案する。
HyperGTはTransformerベースのニューラルネットワークアーキテクチャを使用して、すべてのノードとハイパーエッジのグローバル相関を効果的に検討する。
局所接続パターンを保ちながら、グローバルな相互作用を効果的に組み込むことで、包括的なハイパーグラフ表現学習を実現する。
論文 参考訳(メタデータ) (2023-12-18T17:50:52Z) - Multi-Granularity Graph Pooling for Video-based Person Re-Identification [14.943835935921296]
ビデオサンプルの時間的特徴と空間的特徴を集約するためにグラフニューラルネットワーク(GNN)が導入された。
STGCNのような既存のグラフベースのモデルは、グラフ表現を得るためにノード機能でtextitmean/textitmaxプールを実行する。
ビデオ検索のための多粒度グラフ表現を学習するためのグラフプーリングネットワーク(GPNet)を提案する。
論文 参考訳(メタデータ) (2022-09-23T13:26:05Z) - Representing Videos as Discriminative Sub-graphs for Action Recognition [165.54738402505194]
ビデオ中の各アクションの識別パターンを表現およびエンコードするためのサブグラフの新たな設計を提案する。
時空グラフとクラスタを各スケールでコンパクトなサブグラフに新たに構築するMUlti-scale Sub-Earn Ling (MUSLE) フレームワークを提案する。
論文 参考訳(メタデータ) (2022-01-11T16:15:25Z) - A Hierarchical Spatio-Temporal Graph Convolutional Neural Network for
Anomaly Detection in Videos [11.423072255384469]
これらの問題に対処する階層型時空間グラフ畳み込みニューラルネットワーク(HSTGCNN)を提案する。
HSTGCNNは、グラフ表現の異なるレベルに対応する複数のブランチで構成されている。
高レベルグラフ表現は、低解像度ビデオにおける人々の移動速度と方向を符号化するために、高レベルグラフ表現は、高解像度ビデオにおける人間の骨格を符号化するために、高レベルグラフ表現が割り当てられる。
論文 参考訳(メタデータ) (2021-12-08T14:03:33Z) - Residual Enhanced Multi-Hypergraph Neural Network [26.42547421121713]
HyperGraph Neural Network (HGNN) はハイパーグラフ表現学習のためのデファクト手法である。
本稿では,各ハイパーグラフからのマルチモーダル情報を効果的に融合できるResidual enhanced Multi-Hypergraph Neural Networkを提案する。
論文 参考訳(メタデータ) (2021-05-02T14:53:32Z) - Spatial-Temporal Correlation and Topology Learning for Person
Re-Identification in Videos [78.45050529204701]
クロススケール空間時空間相関をモデル化し, 識別的, 堅牢な表現を追求する新しい枠組みを提案する。
CTLはCNNバックボーンとキーポイント推定器を使用して人体から意味的局所的特徴を抽出する。
グローバルな文脈情報と人体の物理的接続の両方を考慮して、多スケールグラフを構築するためのコンテキスト強化トポロジーを探求する。
論文 参考訳(メタデータ) (2021-04-15T14:32:12Z) - Spatial-spectral Hyperspectral Image Classification via Multiple Random
Anchor Graphs Ensemble Learning [88.60285937702304]
本稿では,複数のランダムアンカーグラフアンサンブル学習(RAGE)を用いた空間スペクトルHSI分類手法を提案する。
まず、各選択されたバンドのより記述的な特徴を抽出し、局所的な構造と領域の微妙な変化を保存するローカルバイナリパターンを採用する。
次に,アンカーグラフの構成に適応隣接代入を導入し,計算複雑性を低減した。
論文 参考訳(メタデータ) (2021-03-25T09:31:41Z) - Multi-Granularity Reference-Aided Attentive Feature Aggregation for
Video-based Person Re-identification [98.7585431239291]
ビデオベースの人物再識別は、同じ人物をビデオクリップ間でマッチングすることを目的としている。
本稿では,マルチグラニュラリティ参照属性集約モジュールMG-RAFAを提案する。
本フレームワークは,3つのベンチマークデータセット上での最先端のアブレーション性能を実現する。
論文 参考訳(メタデータ) (2020-03-27T03:49:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。