論文の概要: Flexible graph convolutional network for 3D human pose estimation
- arxiv url: http://arxiv.org/abs/2407.19077v1
- Date: Fri, 26 Jul 2024 20:46:28 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-30 20:02:28.868146
- Title: Flexible graph convolutional network for 3D human pose estimation
- Title(参考訳): 3次元ポーズ推定のためのフレキシブルグラフ畳み込みネットワーク
- Authors: Abu Taib Mohammed Shahjahan, A. Ben Hamza,
- Abstract要約: より広範なグローバル情報や依存関係をキャプチャするグラフ表現を学習するために設計されたフレキシブルなグラフ畳み込みネットワークであるFlex-GCNを紹介します。
中心となるのはフレキシブルグラフの畳み込みであり、各ノードの即時および二階隣人の両方の特徴を集約する。
我々のネットワークアーキテクチャは、フレキシブルグラフ畳み込み層の残留ブロックと、グローバルな特徴集約、正規化、キャリブレーションのためのグローバル応答正規化層から構成される。
- 参考スコア(独自算出の注目度): 4.696083734269233
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Although graph convolutional networks exhibit promising performance in 3D human pose estimation, their reliance on one-hop neighbors limits their ability to capture high-order dependencies among body joints, crucial for mitigating uncertainty arising from occlusion or depth ambiguity. To tackle this limitation, we introduce Flex-GCN, a flexible graph convolutional network designed to learn graph representations that capture broader global information and dependencies. At its core is the flexible graph convolution, which aggregates features from both immediate and second-order neighbors of each node, while maintaining the same time and memory complexity as the standard convolution. Our network architecture comprises residual blocks of flexible graph convolutional layers, as well as a global response normalization layer for global feature aggregation, normalization and calibration. Quantitative and qualitative results demonstrate the effectiveness of our model, achieving competitive performance on benchmark datasets.
- Abstract(参考訳): グラフ畳み込みネットワークは、人間の3次元ポーズ推定において有望な性能を示すが、片足の隣人への依存は、咬合や奥行きのあいまいさによる不確実性を軽減するために欠かせない、体節間の高次依存関係を捕捉する能力を制限する。
この制限に対処するために、より広範なグローバル情報や依存関係をキャプチャするグラフ表現を学習するために設計されたフレキシブルなグラフ畳み込みネットワークであるFlex-GCNを紹介します。
中心となるのはフレキシブルグラフの畳み込みであり、これは各ノードの即時および二階隣の機能を集約し、標準の畳み込みと同じ時間とメモリの複雑さを維持する。
我々のネットワークアーキテクチャは、フレキシブルグラフ畳み込み層の残留ブロックと、グローバルな特徴集約、正規化、キャリブレーションのためのグローバル応答正規化層から構成される。
定量的および定性的な結果から,ベンチマークデータセット上での競合性能を向上し,本モデルの有効性を示す。
関連論文リスト
- Multi-hop graph transformer network for 3D human pose estimation [4.696083734269233]
本稿では,2次元から3次元の人間のポーズ推定を目的としたマルチホップグラフトランスフォーマーネットワークを提案する。
提案するネットワークアーキテクチャは,多頭部自己注意層と学習可能な隣接行列を用いたグラフ畳み込みからなるグラフアテンションブロックで構成されている。
拡張畳み込み層の統合により、人体関節の正確な位置決めに必要な空間的一般化を扱う能力が向上する。
論文 参考訳(メタデータ) (2024-05-05T21:29:20Z) - Graph Transformer GANs with Graph Masked Modeling for Architectural
Layout Generation [153.92387500677023]
本稿では,グラフノード関係を効果的に学習するために,GTGAN(Graph Transformer Generative Adversarial Network)を提案する。
提案したグラフ変換器エンコーダは、局所的およびグローバルな相互作用をモデル化するために、Transformer内のグラフ畳み込みと自己アテンションを組み合わせる。
また,グラフ表現学習のための自己指導型事前学習手法を提案する。
論文 参考訳(メタデータ) (2024-01-15T14:36:38Z) - ResolvNet: A Graph Convolutional Network with multi-scale Consistency [47.98039061491647]
マルチスケール一貫性の概念を導入する。
グラフレベルでは、マルチスケールの一貫性は、異なる解像度で同じオブジェクトを記述する異なるグラフが同様の特徴ベクトルを割り当てるべきという事実を指す。
本稿では,リゾルダーの数学的概念に基づくフレキシブルグラフニューラルネットワークResolvNetを紹介する。
論文 参考訳(メタデータ) (2023-09-30T16:46:45Z) - Iterative Graph Filtering Network for 3D Human Pose Estimation [5.177947445379688]
グラフ畳み込みネットワーク(GCN)は3次元人間のポーズ推定に有効な手法であることが証明されている。
本稿では,3次元ポーズ推定のための反復グラフフィルタリングフレームワークを提案する。
我々のアプローチは、ラプラシア正規化によるグラフフィルタリングを反復的に解くという考え方に基づいている。
論文 参考訳(メタデータ) (2023-07-29T20:46:44Z) - Graph Transformer GANs for Graph-Constrained House Generation [223.739067413952]
本稿では,グラフノード関係を効果的に学習するために,GTGAN(Graph Transformer Generative Adversarial Network)を提案する。
GTGANは、グラフ制約のある住宅生成タスクにおいて、エンドツーエンドで効率的なグラフノード関係を学習する。
論文 参考訳(メタデータ) (2023-03-14T20:35:45Z) - GrannGAN: Graph annotation generative adversarial networks [72.66289932625742]
本稿では,高次元分布をモデル化し,グラフスケルトンと整合した複雑な関係特徴構造を持つデータの新しい例を生成することの問題点を考察する。
提案するモデルは,タスクを2つのフェーズに分割することで,各データポイントのグラフ構造に制約されたデータ特徴を生成する問題に対処する。
第一に、与えられたグラフのノードに関連する機能の分布をモデル化し、第二に、ノードのフィーチャに条件付きでエッジ機能を補完する。
論文 参考訳(メタデータ) (2022-12-01T11:49:07Z) - Towards Relation-centered Pooling and Convolution for Heterogeneous
Graph Learning Networks [11.421162988355146]
不均一グラフニューラルネットワークは,グラフ表現学習において大きな可能性を秘めている。
我々は,PC-HGNという異種グラフ学習ネットワークのための関係中心のPooling and Convolutionを設計し,関係固有サンプリングと相互関係の畳み込みを実現する。
実世界の3つのデータセットにおける最先端グラフ学習モデルとの比較により,提案モデルの性能評価を行った。
論文 参考訳(メタデータ) (2022-10-31T08:43:32Z) - Multi-Level Graph Convolutional Network with Automatic Graph Learning
for Hyperspectral Image Classification [63.56018768401328]
HSI分類のための自動グラフ学習法(MGCN-AGL)を用いたマルチレベルグラフ畳み込みネットワーク(GCN)を提案する。
空間的に隣接する領域における重要度を特徴付けるために注意機構を利用することで、最も関連性の高い情報を適応的に組み込んで意思決定を行うことができる。
MGCN-AGLは局所的に生成した表現表現に基づいて画像領域間の長距離依存性を符号化する。
論文 参考訳(メタデータ) (2020-09-19T09:26:20Z) - Smoothness Sensor: Adaptive Smoothness-Transition Graph Convolutions for
Attributed Graph Clustering [10.905770964670191]
適応的滑らか度-遷移グラフ畳み込みに基づく属性グラフクラスタリングのための滑らか度センサを提案する。
グラフレベルの滑らかさの代替として,新しい細粒度ノード単位の滑らかさ評価法を提案する。
実験の結果,提案手法は3つの異なる指標で,他の12の最先端のベースラインを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2020-09-12T08:12:27Z) - Tensor Graph Convolutional Networks for Multi-relational and Robust
Learning [74.05478502080658]
本稿では,テンソルで表されるグラフの集合に関連するデータから,スケーラブルな半教師付き学習(SSL)を実現するためのテンソルグラフ畳み込みネットワーク(TGCN)を提案する。
提案アーキテクチャは、標準的なGCNと比較して大幅に性能が向上し、最先端の敵攻撃に対処し、タンパク質間相互作用ネットワーク上でのSSL性能が著しく向上する。
論文 参考訳(メタデータ) (2020-03-15T02:33:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。