論文の概要: Learning Spatial Context with Graph Neural Network for Multi-Person Pose
Grouping
- arxiv url: http://arxiv.org/abs/2104.02385v1
- Date: Tue, 6 Apr 2021 09:21:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-07 14:06:22.608073
- Title: Learning Spatial Context with Graph Neural Network for Multi-Person Pose
Grouping
- Title(参考訳): マルチパーソン・ポース・グルーピングのためのグラフニューラルネットワークを用いた空間文脈の学習
- Authors: Jiahao Lin, Gim Hee Lee
- Abstract要約: イメージベース多人数ポーズ推定のためのボトムアップ手法は,キーポイント検出とグループ化の2段階からなる。
本研究では,グラフ分割問題としてグループ化タスクを定式化し,グラフニューラルネットワーク(gnn)を用いて親和性行列を学習する。
学習された幾何学に基づく親和性は、強固なキーポイント結合を達成するために外観に基づく親和性とさらに融合する。
- 参考スコア(独自算出の注目度): 71.59494156155309
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Bottom-up approaches for image-based multi-person pose estimation consist of
two stages: (1) keypoint detection and (2) grouping of the detected keypoints
to form person instances. Current grouping approaches rely on learned embedding
from only visual features that completely ignore the spatial configuration of
human poses. In this work, we formulate the grouping task as a graph
partitioning problem, where we learn the affinity matrix with a Graph Neural
Network (GNN). More specifically, we design a Geometry-aware Association GNN
that utilizes spatial information of the keypoints and learns local affinity
from the global context. The learned geometry-based affinity is further fused
with appearance-based affinity to achieve robust keypoint association. Spectral
clustering is used to partition the graph for the formation of the pose
instances. Experimental results on two benchmark datasets show that our
proposed method outperforms existing appearance-only grouping frameworks, which
shows the effectiveness of utilizing spatial context for robust grouping.
Source code is available at: https://github.com/jiahaoLjh/PoseGrouping.
- Abstract(参考訳): イメージベース多人数ポーズ推定のためのボトムアップアプローチは,(1)キーポイント検出と(2)検出されたキーポイントのグループ化の2段階からなる。
現在のグループ化アプローチは、人間のポーズの空間構成を完全に無視する視覚機能のみから学習された埋め込みに依存している。
本研究では,グラフ分割問題としてグループ化タスクを定式化し,グラフニューラルネットワーク(gnn)を用いて親和性行列を学習する。
より具体的には、キーポイントの空間情報を活用し、グローバルな文脈から局所親和性を学ぶGeometry-Aware Association GNNを設計する。
学習された幾何学に基づく親和性は、強固なキーポイント結合を達成するために外観に基づく親和性とさらに融合する。
スペクトルクラスタリングは、ポーズインスタンスの形成のためにグラフを分割するために使用される。
2つのベンチマークデータセットによる実験結果から,提案手法は既存の外見のみのグルーピングフレームワークよりも優れており,ロバストグルーピングにおける空間コンテキストの利用の有効性が示されている。
ソースコードは、https://github.com/jiahaoLjh/PoseGrouping.comで入手できる。
関連論文リスト
- Unified and Dynamic Graph for Temporal Character Grouping in Long Videos [31.192044026127032]
ビデオ時間的キャラクタグループ化は、ビデオ内の主要なキャラクタの出現モーメントを、そのアイデンティティに応じて特定する。
最近の研究は、教師なしクラスタリングからグラフベースのクラスタリングへと進化してきた。
時間的文字グループ化のための統一動的グラフ(UniDG)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-27T13:22:55Z) - Image as Set of Points [60.30495338399321]
コンテキストクラスタ(CoC)は、イメージを非組織的なポイントの集合と見なし、単純化されたクラスタリングアルゴリズムによって特徴を抽出する。
われわれのCoCは畳み込みと無注意で、空間的相互作用のためのクラスタリングアルゴリズムにのみ依存している。
論文 参考訳(メタデータ) (2023-03-02T18:56:39Z) - Dual Contrastive Attributed Graph Clustering Network [6.796682703663566]
我々はDCAGC(Dual Contrastive Attributed Graph Clustering Network)と呼ばれる汎用フレームワークを提案する。
DCAGCでは、近隣のコントラストモジュールを利用することで、近隣ノードの類似性を最大化し、ノード表現の品質を向上させる。
DCAGCのすべてのモジュールは、統一されたフレームワークでトレーニングされ、最適化されているため、学習されたノード表現にはクラスタリング指向のメッセージが含まれている。
論文 参考訳(メタデータ) (2022-06-16T03:17:01Z) - GROWL: Group Detection With Link Prediction [0.0]
グラフニューラルネットワーク(GNN)に基づくグループ検出に対する総合的アプローチを提案する。
提案手法であるGROup Detection With Link Predictionは,GNNに基づく手法の有効性を実証する。
以上の結果から,GNNに基づくアプローチは,異なるカメラビューにおける精度を大幅に向上させることができることがわかった。
論文 参考訳(メタデータ) (2021-11-08T11:52:48Z) - Improving Facial Attribute Recognition by Group and Graph Learning [34.39507051712628]
属性間の関係を爆発させることは、顔属性認識を改善する上で重要な課題である。
本研究では,空間的関係と非空間的関係の2種類の相関関係について考察する。
マルチスケールグループとグラフネットワークという統合ネットワークを提案する。
論文 参考訳(メタデータ) (2021-05-28T13:36:28Z) - Spatial-spectral Hyperspectral Image Classification via Multiple Random
Anchor Graphs Ensemble Learning [88.60285937702304]
本稿では,複数のランダムアンカーグラフアンサンブル学習(RAGE)を用いた空間スペクトルHSI分類手法を提案する。
まず、各選択されたバンドのより記述的な特徴を抽出し、局所的な構造と領域の微妙な変化を保存するローカルバイナリパターンを採用する。
次に,アンカーグラフの構成に適応隣接代入を導入し,計算複雑性を低減した。
論文 参考訳(メタデータ) (2021-03-25T09:31:41Z) - Structured Graph Learning for Scalable Subspace Clustering: From
Single-view to Multi-view [28.779909990410978]
グラフベースのサブスペースクラスタリング手法は有望な性能を示した。
コストのかかる時間のオーバーヘッドに遭遇し、明示的なクラスタの探索に失敗し、見えないデータポイントに一般化することはできません。
上記の3つの課題を同時に解決しようとする,スケーラブルなグラフ学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-16T03:46:11Z) - Differentiable Hierarchical Graph Grouping for Multi-Person Pose
Estimation [95.72606536493548]
複数の人の身体のキーポイントを同時にローカライズするため、複数の人物のポーズ推定は困難である。
ボトムアップ型多人数ポーズ推定タスクにおけるグラフグループ化を学習するための,新しい微分可能な階層グラフグループ化(HGG)手法を提案する。
論文 参考訳(メタデータ) (2020-07-23T08:46:22Z) - Learning to Cluster Faces via Confidence and Connectivity Estimation [136.5291151775236]
重複する部分グラフを多数必要とせず,完全に学習可能なクラスタリングフレームワークを提案する。
提案手法はクラスタリングの精度を大幅に向上させ,その上で訓練した認識モデルの性能を向上させるが,既存の教師付き手法に比べて桁違いに効率的である。
論文 参考訳(メタデータ) (2020-04-01T13:39:37Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。