論文の概要: Pixel-wise Graph Attention Networks for Person Re-identification
- arxiv url: http://arxiv.org/abs/2307.09183v1
- Date: Tue, 18 Jul 2023 12:12:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-19 15:04:07.505935
- Title: Pixel-wise Graph Attention Networks for Person Re-identification
- Title(参考訳): 人物識別のための画素単位グラフ注意ネットワーク
- Authors: Wenyu Zhang, Qing Ding, Jian Hu, Yi Ma, Mingzhe Lu
- Abstract要約: グラフ畳み込みネットワーク(GCN)は不規則データを扱うために広く使われている。
構造化データ(画像など)にGCNを適用する方法については、まだ深く研究されていない。
本稿では,画像特徴抽出におけるグラフアテンションネットワーク(GAT)の適用について検討する。
- 参考スコア(独自算出の注目度): 18.662170017063286
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Graph convolutional networks (GCN) is widely used to handle irregular data
since it updates node features by using the structure information of graph.
With the help of iterated GCN, high-order information can be obtained to
further enhance the representation of nodes. However, how to apply GCN to
structured data (such as pictures) has not been deeply studied. In this paper,
we explore the application of graph attention networks (GAT) in image feature
extraction. First of all, we propose a novel graph generation algorithm to
convert images into graphs through matrix transformation. It is one magnitude
faster than the algorithm based on K Nearest Neighbors (KNN). Then, GAT is used
on the generated graph to update the node features. Thus, a more robust
representation is obtained. These two steps are combined into a module called
pixel-wise graph attention module (PGA). Since the graph obtained by our graph
generation algorithm can still be transformed into a picture after processing,
PGA can be well combined with CNN. Based on these two modules, we consulted the
ResNet and design a pixel-wise graph attention network (PGANet). The PGANet is
applied to the task of person re-identification in the datasets Market1501,
DukeMTMC-reID and Occluded-DukeMTMC (outperforms state-of-the-art by 0.8\%,
1.1\% and 11\% respectively, in mAP scores). Experiment results show that it
achieves the state-of-the-art performance.
\href{https://github.com/wenyu1009/PGANet}{The code is available here}.
- Abstract(参考訳): グラフ畳み込みネットワーク(GCN)は、グラフの構造情報を用いてノードの特徴を更新するため、不規則なデータを扱うために広く使われている。
繰り返しGCNの助けを借りて、高次情報を取得し、ノードの表現をさらに強化することができる。
しかし、GCNを構造化データ(画像など)に適用する方法は、まだ深く研究されていない。
本稿では,画像特徴抽出におけるグラフアテンションネットワーク(gat)の応用について検討する。
まず,行列変換により画像からグラフに変換する新しいグラフ生成アルゴリズムを提案する。
K Nearest Neighbors (KNN) に基づくアルゴリズムよりも1桁高速である。
次に、生成したグラフ上でGATを使用してノード機能を更新する。
これにより、より堅牢な表現が得られる。
これら2つのステップは、ピクセルワイドグラフアテンションモジュール(PGA)と呼ばれるモジュールに結合される。
グラフ生成アルゴリズムで得られたグラフは処理後に画像に変換することができるため、PGAはCNNとうまく結合することができる。
これら2つのモジュールに基づいて, resnet と pixel-wise graph attention network (pganet) の設計を行った。
PGANetは、データセットMarket1501、DukeMTMC-reID、Occluded-DukeMTMC(mAPスコアでそれぞれ0.8\%、1.1\%、11\%)の個人再識別タスクに適用される。
実験の結果,最先端の性能が得られた。
https://github.com/wenyu1009/pganet}{the codeはここで入手できる。
関連論文リスト
- InstructG2I: Synthesizing Images from Multimodal Attributed Graphs [50.852150521561676]
InstructG2Iと呼ばれるグラフ文脈条件拡散モデルを提案する。
InstructG2Iはまずグラフ構造とマルチモーダル情報を利用して情報的隣人サンプリングを行う。
Graph-QFormerエンコーダは、グラフノードをグラフプロンプトの補助セットに適応的に符号化し、デノナイジングプロセスを導く。
論文 参考訳(メタデータ) (2024-10-09T17:56:15Z) - Learning on Large Graphs using Intersecting Communities [13.053266613831447]
MPNNは、各ノードの隣人からのメッセージを集約することで、入力グラフ内の各ノードの表現を反復的に更新する。
MPNNは、あまりスパースではないため、すぐに大きなグラフの禁止になるかもしれない。
本稿では,入力グラフを交差するコミュニティグラフ (ICG) として近似することを提案する。
論文 参考訳(メタデータ) (2024-05-31T09:26:26Z) - Graph Mixup with Soft Alignments [49.61520432554505]
本研究では,画像上での使用に成功しているミキサアップによるグラフデータの増大について検討する。
ソフトアライメントによるグラフ分類のための簡易かつ効果的な混合手法であるS-Mixupを提案する。
論文 参考訳(メタデータ) (2023-06-11T22:04:28Z) - FoSR: First-order spectral rewiring for addressing oversquashing in GNNs [0.0]
グラフニューラルネットワーク(GNN)は、グラフのエッジに沿ってメッセージを渡すことによって、グラフデータの構造を活用することができる。
本稿では,グラフにエッジを体系的に付加することで過疎化を防止する計算効率のよいアルゴリズムを提案する。
提案アルゴリズムは,いくつかのグラフ分類タスクにおいて,既存のグラフリウィリング手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-10-21T07:58:03Z) - Multi-Granularity Graph Pooling for Video-based Person Re-Identification [14.943835935921296]
ビデオサンプルの時間的特徴と空間的特徴を集約するためにグラフニューラルネットワーク(GNN)が導入された。
STGCNのような既存のグラフベースのモデルは、グラフ表現を得るためにノード機能でtextitmean/textitmaxプールを実行する。
ビデオ検索のための多粒度グラフ表現を学習するためのグラフプーリングネットワーク(GPNet)を提案する。
論文 参考訳(メタデータ) (2022-09-23T13:26:05Z) - Neighbor2Seq: Deep Learning on Massive Graphs by Transforming Neighbors
to Sequences [55.329402218608365]
本研究では,各ノードの階層的近傍をシーケンスに変換するためにNeighbor2Seqを提案する。
1100万以上のノードと160億のエッジを持つ大規模グラフ上で,本手法の評価を行った。
その結果,提案手法は大規模グラフに対してスケーラブルであり,大規模グラフと中規模グラフにまたがる優れた性能を実現する。
論文 参考訳(メタデータ) (2022-02-07T16:38:36Z) - Graph Transformer Networks: Learning Meta-path Graphs to Improve GNNs [20.85042364993559]
本稿では,新しいグラフ構造を生成し,タスクに有用な接続を含むグラフトランスフォーマーネットワーク(GTN)を提案する。
Fast Graph Transformer Networks (FastGTNs) は230倍高速で、100倍少ないメモリを使用する。
グラフ変換を、メタパスを超えた非局所的な操作を可能にするノードの意味的近接に拡張する。
論文 参考訳(メタデータ) (2021-06-11T07:56:55Z) - Graph Convolutional Networks in Feature Space for Image Deblurring and
Super-resolution [11.531085904098003]
グラフ畳み込みを付加した新しいエンコーダデコーダネットワークを提案する。
実験により、画像復元作業のパフォーマンスが著しく向上することが示された。
より多くのアプリケーションにおいて、GCNベースのアプローチの機会が開けると信じています。
論文 参考訳(メタデータ) (2021-05-21T17:02:15Z) - Scaling Graph Neural Networks with Approximate PageRank [64.92311737049054]
GNNにおける情報拡散の効率的な近似を利用したPPRGoモデルを提案する。
高速であることに加えて、PPRGoは本質的にスケーラブルであり、業界設定で見られるような大規模なデータセットに対して、自明に並列化することができる。
このグラフのすべてのノードに対するPPRGoのトレーニングとラベルの予測には1台のマシンで2分未満で、同じグラフ上の他のベースラインをはるかに上回ります。
論文 参考訳(メタデータ) (2020-07-03T09:30:07Z) - Graph Pooling with Node Proximity for Hierarchical Representation
Learning [80.62181998314547]
本稿では,ノード近接を利用したグラフプーリング手法を提案し,そのマルチホップトポロジを用いたグラフデータの階層的表現学習を改善する。
その結果,提案したグラフプーリング戦略は,公開グラフ分類ベンチマークデータセットの集合において,最先端のパフォーマンスを達成できることが示唆された。
論文 参考訳(メタデータ) (2020-06-19T13:09:44Z) - Sequential Graph Convolutional Network for Active Learning [53.99104862192055]
逐次グラフ畳み込みネットワーク(GCN)を用いた新しいプールベースアクティブラーニングフレームワークを提案する。
少数のランダムなサンプル画像がシードラベル付き例であるので、グラフのパラメータを学習してラベル付きノードと非ラベル付きノードを区別する。
我々はGCNの特性を利用してラベル付けされたものと十分に異なる未ラベルの例を選択する。
論文 参考訳(メタデータ) (2020-06-18T00:55:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。