論文の概要: Interweaved Graph and Attention Network for 3D Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2304.14045v1
- Date: Thu, 27 Apr 2023 09:21:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-28 13:57:28.041790
- Title: Interweaved Graph and Attention Network for 3D Human Pose Estimation
- Title(参考訳): 人間の3次元姿勢推定のための間隙グラフと注意ネットワーク
- Authors: Ti Wang, Hong Liu, Runwei Ding, Wenhao Li, Yingxuan You, Xia Li
- Abstract要約: IGANet(Interweaved Graph and Attention Network)を提案する。
IGANetは、グラフ畳み込みネットワーク(GCN)とアテンション間の双方向通信を可能にする。
我々はIGAモジュールを導入し、GCNのローカル情報とGCNのグローバル情報とをアテンションから注入する。
- 参考スコア(独自算出の注目度): 15.699524854176644
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite substantial progress in 3D human pose estimation from a single-view
image, prior works rarely explore global and local correlations, leading to
insufficient learning of human skeleton representations. To address this issue,
we propose a novel Interweaved Graph and Attention Network (IGANet) that allows
bidirectional communications between graph convolutional networks (GCNs) and
attentions. Specifically, we introduce an IGA module, where attentions are
provided with local information from GCNs and GCNs are injected with global
information from attentions. Additionally, we design a simple yet effective
U-shaped multi-layer perceptron (uMLP), which can capture multi-granularity
information for body joints. Extensive experiments on two popular benchmark
datasets (i.e. Human3.6M and MPI-INF-3DHP) are conducted to evaluate our
proposed method.The results show that IGANet achieves state-of-the-art
performance on both datasets. Code is available at
https://github.com/xiu-cs/IGANet.
- Abstract(参考訳): 単視点画像からの3次元人物ポーズ推定のかなりの進歩にもかかわらず、先行研究は地球的および局所的な相関をほとんど探求せず、人間の骨格表現の学習が不十分になってしまう。
この問題に対処するために、我々は、グラフ畳み込みネットワーク(GCN)と注目の間の双方向通信を可能にする、新しいIGANet(Interweaved Graph and Attention Network)を提案する。
具体的には、GCNのローカル情報とGCNのローカル情報と、注意情報からグローバル情報とを注入するIGAモジュールを導入する。
さらに,生体関節のマルチグラニュラ情報をキャプチャ可能な,単純かつ効果的なu型多層パーセプトロン(umlp)を設計した。
提案手法を評価するために,2つの一般的なベンチマークデータセット(Human3.6MとMPI-INF-3DHP)の大規模な実験を行った。
コードはhttps://github.com/xiu-cs/IGANetで入手できる。
関連論文リスト
- Graph Triple Attention Network: A Decoupled Perspective [8.958483386270638]
グラフトランスフォーマーは、マルチビューカオスとローカルグローバルカオスの2つの主要な課題に直面している。
我々は、GTの高レベルな分離された視点を提案し、それらを3つのコンポーネントと2つの相互作用レベルに分解する。
DeGTAというグラフトリプルアテンションネットワークを設計し、多視点アテンションを別々に計算し、多視点ローカルおよびグローバル情報を適応的に統合する。
論文 参考訳(メタデータ) (2024-08-14T16:29:07Z) - Representation Learning on Heterophilic Graph with Directional
Neighborhood Attention [8.493802098034255]
Graph Attention Network(GAT)は、最も人気のあるGraph Neural Network(GNN)アーキテクチャの1つである。
GATは、長距離およびグローバルグラフ情報をキャプチャする能力に欠けており、いくつかのデータセットで不満足なパフォーマンスをもたらす。
本稿では,特徴に基づく注意と,グラフトポロジから抽出したグローバルな方向性情報を組み合わせるために,DGAT(Directional Graph Attention Network)を提案する。
論文 参考訳(メタデータ) (2024-03-03T10:59:16Z) - Iterative Graph Filtering Network for 3D Human Pose Estimation [5.177947445379688]
グラフ畳み込みネットワーク(GCN)は3次元人間のポーズ推定に有効な手法であることが証明されている。
本稿では,3次元ポーズ推定のための反復グラフフィルタリングフレームワークを提案する。
我々のアプローチは、ラプラシア正規化によるグラフフィルタリングを反復的に解くという考え方に基づいている。
論文 参考訳(メタデータ) (2023-07-29T20:46:44Z) - Learning Strong Graph Neural Networks with Weak Information [64.64996100343602]
我々は、弱い情報(GLWI)を用いたグラフ学習問題に対する原則的アプローチを開発する。
非完全構造を持つ入力グラフ上で長距離情報伝搬を行うデュアルチャネルGNNフレームワークであるD$2$PTを提案するが、グローバルな意味的類似性を符号化するグローバルグラフも提案する。
論文 参考訳(メタデータ) (2023-05-29T04:51:09Z) - DigNet: Digging Clues from Local-Global Interactive Graph for
Aspect-level Sentiment Classification [0.685316573653194]
アスペクトレベルの感情分類(ASC)では、最先端モデルは構文グラフまたは関係グラフをエンコードする。
我々は,対話的なエッジを通じて2つのグラフを縫い合わせることで,その利点をマージする,新しいローカル・グローバル・インタラクティブグラフを設計する。
本稿では,DigNetと呼ばれる新しいニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2022-01-04T05:34:02Z) - Graph-Based 3D Multi-Person Pose Estimation Using Multi-View Images [79.70127290464514]
我々は,タスクを2つの段階,すなわち人物のローカライゼーションとポーズ推定に分解する。
また,効率的なメッセージパッシングのための3つのタスク固有グラフニューラルネットワークを提案する。
提案手法は,CMU Panoptic と Shelf のデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2021-09-13T11:44:07Z) - Spatial-Temporal Correlation and Topology Learning for Person
Re-Identification in Videos [78.45050529204701]
クロススケール空間時空間相関をモデル化し, 識別的, 堅牢な表現を追求する新しい枠組みを提案する。
CTLはCNNバックボーンとキーポイント推定器を使用して人体から意味的局所的特徴を抽出する。
グローバルな文脈情報と人体の物理的接続の両方を考慮して、多スケールグラフを構築するためのコンテキスト強化トポロジーを探求する。
論文 参考訳(メタデータ) (2021-04-15T14:32:12Z) - An Adversarial Human Pose Estimation Network Injected with Graph
Structure [75.08618278188209]
本稿では,いくつかの関節が見えない場合に,可視関節の局所化精度を向上させるために,新しいGAN(Generative Adversarial Network)を設計する。
ネットワークは、2つのシンプルで効率的なモジュール、カスケード機能ネットワーク(CFN)とグラフ構造ネットワーク(GSN)で構成されています。
論文 参考訳(メタデータ) (2021-03-29T12:07:08Z) - PC-RGNN: Point Cloud Completion and Graph Neural Network for 3D Object
Detection [57.49788100647103]
LiDARベースの3Dオブジェクト検出は、自動運転にとって重要なタスクです。
現在のアプローチでは、遠方および閉ざされた物体の偏りと部分的な点雲に苦しむ。
本稿では,この課題を2つの解決法で解決する新しい二段階アプローチ,pc-rgnnを提案する。
論文 参考訳(メタデータ) (2020-12-18T18:06:43Z) - Multi-Level Graph Convolutional Network with Automatic Graph Learning
for Hyperspectral Image Classification [63.56018768401328]
HSI分類のための自動グラフ学習法(MGCN-AGL)を用いたマルチレベルグラフ畳み込みネットワーク(GCN)を提案する。
空間的に隣接する領域における重要度を特徴付けるために注意機構を利用することで、最も関連性の高い情報を適応的に組み込んで意思決定を行うことができる。
MGCN-AGLは局所的に生成した表現表現に基づいて画像領域間の長距離依存性を符号化する。
論文 参考訳(メタデータ) (2020-09-19T09:26:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。