論文の概要: Multi-Granularity Graph Pooling for Video-based Person Re-Identification
- arxiv url: http://arxiv.org/abs/2209.11584v1
- Date: Fri, 23 Sep 2022 13:26:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-26 16:49:18.607739
- Title: Multi-Granularity Graph Pooling for Video-based Person Re-Identification
- Title(参考訳): ビデオベース人物再同定のための多次元グラフプーリング
- Authors: Honghu Pan, Yongyong Chen, Zhenyu He
- Abstract要約: ビデオサンプルの時間的特徴と空間的特徴を集約するためにグラフニューラルネットワーク(GNN)が導入された。
STGCNのような既存のグラフベースのモデルは、グラフ表現を得るためにノード機能でtextitmean/textitmaxプールを実行する。
ビデオ検索のための多粒度グラフ表現を学習するためのグラフプーリングネットワーク(GPNet)を提案する。
- 参考スコア(独自算出の注目度): 14.943835935921296
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The video-based person re-identification (ReID) aims to identify the given
pedestrian video sequence across multiple non-overlapping cameras.
To aggregate the temporal and spatial features of the video samples, the
graph neural networks (GNNs) are introduced.
However, existing graph-based models, like STGCN, perform the
\textit{mean}/\textit{max pooling} on node features to obtain the graph
representation, which neglect the graph topology and node importance.
In this paper, we propose the graph pooling network (GPNet) to learn the
multi-granularity graph representation for the video retrieval, where the
\textit{graph pooling layer} is implemented to downsample the graph.
We first construct a multi-granular graph, whose node features denote image
embedding learned by backbone, and edges are established between the temporal
and Euclidean neighborhood nodes.
We then implement multiple graph convolutional layers to perform the
neighborhood aggregation on the graphs.
To downsample the graph, we propose a multi-head full attention graph pooling
(MHFAPool) layer, which integrates the advantages of existing node clustering
and node selection pooling methods.
Specifically, MHFAPool takes the main eigenvector of full attention matrix as
the aggregation coefficients to involve the global graph information in each
pooled nodes.
Extensive experiments demonstrate that our GPNet achieves the competitive
results on four widely-used datasets, i.e., MARS, DukeMTMC-VideoReID, iLIDS-VID
and PRID-2011.
- Abstract(参考訳): reid (video-based person re-identification) は、複数の非重なりカメラにまたがる歩行者映像のシーケンスを識別することを目的としている。
ビデオサンプルの時間的特徴と空間的特徴を集約するために、グラフニューラルネットワーク(GNN)を導入する。
しかし、stgcnのような既存のグラフベースのモデルは、グラフのトポロジーとノードの重要性を無視するグラフ表現を得るために、ノードの機能で \textit{mean}/\textit{max pooling} を実行する。
本稿では,ビデオ検索のための多粒度グラフ表現を学習するためのグラフプーリングネットワーク(GPNet)を提案する。
まず,ノードの特徴がバックボーンで学習した画像埋め込みを示す多面グラフを構築し,その辺は時空ノードとユークリッドノードの間で確立する。
次に,複数のグラフ畳み込み層を実装し,グラフの近傍アグリゲーションを行う。
グラフをダウンサンプリングするために,既存のノードクラスタリングとノード選択プーリングの利点を統合したマルチヘッドフルアテンショングラフプーリング(MHFAPool)層を提案する。
具体的には、MHFAPoolは全注目行列の固有ベクトルを集約係数として取り、各プールノードのグローバルグラフ情報を含む。
GPNetは、MARS、DukeMTMC-VideoReID、iLIDS-VID、PRID-2011の4つの広く使われているデータセットに対して、競争結果が得られることを示した。
関連論文リスト
- Graph Parsing Networks [64.5041886737007]
本稿では,効率的なグラフ解析アルゴリズムを提案する。
結果として得られるグラフパーシングネットワーク(GPN)は、個々のグラフに対してパーソナライズされたプーリング構造を適応的に学習する。
論文 参考訳(メタデータ) (2024-02-22T09:08:36Z) - Saliency-Aware Regularized Graph Neural Network [39.82009838086267]
グラフ分類のためのSAR-GNN(Saliency-Aware Regularized Graph Neural Network)を提案する。
まず,コンパクトなグラフ表現とノード特徴とのセマンティックな類似性を測定することで,グローバルノードの正当性を推定する。
そして、学習した塩分濃度分布を利用して、背骨の近傍集合を規則化する。
論文 参考訳(メタデータ) (2024-01-01T13:44:16Z) - MPool: Motif-Based Graph Pooling [0.0]
グラフニューラルネットワーク(GNN)は近年,グラフ分類を含む多くのグラフ関連タスクにおいて,強力な技術となっている。
マルチチャネルモチーフに基づくグラフポーリング手法(MPool)を提案する。
第1のチャネルとして、ノードのモチーフ隣接性を考慮したノードランキングモデルを設計し、ノード選択に基づくグラフプーリングを開発する。
第2のチャネルとして、モチーフアジャシエンスを用いたスペクトルクラスタリングモデルを設計し、クラスタベースのグラフプーリングを開発する。
最終層として、各チャネルの結果を最終グラフ表現に集約する。
論文 参考訳(メタデータ) (2023-03-07T05:21:15Z) - LiftPool: Lifting-based Graph Pooling for Hierarchical Graph
Representation Learning [53.176603566951016]
階層グラフ表現を改善するために,リフトプール (LiftPool) と呼ばれるリフトによる3段階法を提案する。
各ノードを削除するために、そのローカル情報は、隣接する保存ノードから集約されたグローバル情報を減らして得られる。
ベンチマークグラフデータセットの評価では、LiftPoolはグラフ分類のタスクにおいて最先端のグラフプーリング手法を大幅に上回っている。
論文 参考訳(メタデータ) (2022-04-27T12:38:02Z) - Edge but not Least: Cross-View Graph Pooling [76.71497833616024]
本稿では,重要なグラフ構造情報を活用するために,クロスビューグラフプーリング(Co-Pooling)手法を提案する。
クロスビュー相互作用、エッジビュープーリング、ノードビュープーリングにより、相互にシームレスに強化され、より情報的なグラフレベルの表現が学習される。
論文 参考訳(メタデータ) (2021-09-24T08:01:23Z) - Accurate Learning of Graph Representations with Graph Multiset Pooling [45.72542969364438]
本稿では,その構造的依存関係に応じてノード間の相互作用をキャプチャするグラフマルチセットトランス (GMT) を提案する。
実験の結果,GMTはグラフ分類ベンチマークにおいて,最先端のグラフプーリング法を著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2021-02-23T07:45:58Z) - Second-Order Pooling for Graph Neural Networks [62.13156203025818]
グラフプーリングとして2次プールを提案するが、これは上記の課題を自然に解決する。
グラフニューラルネットワークによる2次プールの直接利用は、実用的な問題を引き起こすことを示す。
本稿では,2次プールに基づく2つの新しいグローバルグラフプーリング手法,すなわちバイリニアマッピングと2次プールを提案する。
論文 参考訳(メタデータ) (2020-07-20T20:52:36Z) - Graph Pooling with Node Proximity for Hierarchical Representation
Learning [80.62181998314547]
本稿では,ノード近接を利用したグラフプーリング手法を提案し,そのマルチホップトポロジを用いたグラフデータの階層的表現学習を改善する。
その結果,提案したグラフプーリング戦略は,公開グラフ分類ベンチマークデータセットの集合において,最先端のパフォーマンスを達成できることが示唆された。
論文 参考訳(メタデータ) (2020-06-19T13:09:44Z) - Structural Temporal Graph Neural Networks for Anomaly Detection in
Dynamic Graphs [54.13919050090926]
本稿では,動的グラフの異常エッジを検出するために,エンドツーエンドの時間構造グラフニューラルネットワークモデルを提案する。
特に,まずターゲットエッジを中心にした$h$ホップ囲むサブグラフを抽出し,各ノードの役割を識別するノードラベル機能を提案する。
抽出した特徴に基づき,GRU(Gated Recurrent Unit)を用いて,異常検出のための時間的情報を取得する。
論文 参考訳(メタデータ) (2020-05-15T09:17:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。