論文の概要: Refinement Module based on Parse Graph of Feature Map for Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2501.11069v1
- Date: Sun, 19 Jan 2025 15:05:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-22 14:22:41.489176
- Title: Refinement Module based on Parse Graph of Feature Map for Human Pose Estimation
- Title(参考訳): 人文推定のための特徴マップのParseグラフに基づくリファインメントモジュール
- Authors: Shibang Liu, Xuemei Xie, Guangming Shi,
- Abstract要約: ヒトの身体のParseグラフは、ヒトのポーズ推定(HPE)を完遂するためにヒトの脳内で得られる。
本稿では、トップダウン分解とボトムアップ結合の2段階を含む機能マップ(RMPG)のParse Graphに基づいてRefinement Moduleを設計する。
本フレームワークは,COCOキーポイント検出,CrowdPose,MPIIヒューマンポーズにおいて優れた結果が得られる。
- 参考スコア(独自算出の注目度): 31.603231536312688
- License:
- Abstract: Parse graphs of the human body can be obtained in the human brain to help humans complete the human pose estimation (HPE). It contains a hierarchical structure, like a tree structure, and context relations among nodes. Many researchers pre-design the parse graph of body structure, and then design framework for HPE. However, these frameworks are difficulty adapting when encountering situations that differ from the preset human structure. Different from them, we regard the feature map as a whole, similarly to human body, so the feature map can be optimized based on parse graphs and each node feature is learned implicitly instead of explicitly, which means it can flexibly respond to different human body structure. In this paper, we design the Refinement Module based on the Parse Graph of feature map (RMPG), which includes two stages: top-down decomposition and bottom-up combination. In the top-down decomposition stage, the feature map is decomposed into multiple sub-feature maps along the channel and their context relations are calculated to obtain their respective context information. In the bottom-up combination stage, the sub-feature maps and their context information are combined to obtain refined sub-feature maps, and then these refined sub-feature maps are concatenated to obtain the refined feature map. Additionally ,we design a top-down framework by using multiple RMPG modules for HPE, some of which are supervised to obtain context relations among body parts. Our framework achieves excellent results on the COCO keypoint detection, CrowdPose and MPII human pose datasets. More importantly, our experiments also demonstrate the effectiveness of RMPG on different methods, including SimpleBaselines, Hourglass, and ViTPose.
- Abstract(参考訳): ヒトの身体のParseグラフはヒトの脳内で取得され、ヒトのポーズ推定(HPE)が完成するのを助ける。
木構造のような階層構造とノード間のコンテキスト関係を含む。
多くの研究者は、ボディ構造のパースグラフを事前設計し、HPEのためのフレームワークを設計した。
しかし、これらの枠組みは、予め設定された人体構造とは異なる状況に遭遇する場合に適応するのが困難である。
それらとは違って,機能マップは人体と同様,機能マップ全体を対象としており,その特徴マップはパースグラフに基づいて最適化可能であり,各ノードの特徴は明示的にではなく暗黙的に学習されるため,柔軟に異なる人体構造に対応することができる。
本稿では、トップダウン分解とボトムアップ結合の2段階を含む機能マップ(RMPG)のParse Graphに基づいてRefinement Moduleを設計する。
トップダウン分解段階では、特徴写像をチャネルに沿って複数のサブフィーチャーマップに分解し、それらのコンテキスト関係を算出して、それぞれのコンテキスト情報を取得する。
ボトムアップ結合段階では、サブフィーチャーマップとそれらのコンテキスト情報を組み合わせて洗練されたサブフィーチャーマップを取得し、これら精製されたサブフィーチャーマップを連結して洗練された特徴マップを得る。
さらに,HPEのための複数のRMPGモジュールを用いてトップダウンフレームワークを設計する。
このフレームワークは,COCOキーポイント検出,CrowdPose,MPIIヒューマンポーズデータセットにおいて優れた結果が得られる。
さらに,本実験では,SimpleBaselines,Hourglass,ViTPoseなど,さまざまな手法におけるRMPGの有効性を実証した。
関連論文リスト
- GrannGAN: Graph annotation generative adversarial networks [72.66289932625742]
本稿では,高次元分布をモデル化し,グラフスケルトンと整合した複雑な関係特徴構造を持つデータの新しい例を生成することの問題点を考察する。
提案するモデルは,タスクを2つのフェーズに分割することで,各データポイントのグラフ構造に制約されたデータ特徴を生成する問題に対処する。
第一に、与えられたグラフのノードに関連する機能の分布をモデル化し、第二に、ノードのフィーチャに条件付きでエッジ機能を補完する。
論文 参考訳(メタデータ) (2022-12-01T11:49:07Z) - SPGP: Structure Prototype Guided Graph Pooling [1.3764085113103217]
グラフレベルの表現を学習するための構造プロトタイプガイドプーリング(SPGP)を提案する。
SPGPはグラフ構造を学習可能なプロトタイプベクトルとして定式化し、ノードとプロトタイプベクトル間の親和性を計算する。
実験の結果,SPGPはグラフ分類ベンチマークデータセットにおいて,最先端のグラフプーリング手法よりも優れていた。
論文 参考訳(メタデータ) (2022-09-16T09:33:09Z) - Primitive Graph Learning for Unified Vector Mapping [14.20286798139897]
GraphMapperは、衛星画像からエンドツーエンドのベクトルマップを抽出するための統合フレームワークである。
ベクトル形状予測,正規化,トポロジー再構成を独自の原始グラフ学習問題に変換する。
提案手法は,両タスクをベンチマークで8~10%向上させる。
論文 参考訳(メタデータ) (2022-06-28T12:33:18Z) - Graph Spectral Embedding using the Geodesic Betweeness Centrality [76.27138343125985]
本稿では、局所的な類似性、接続性、グローバル構造を教師なしで表現するグラフSylvester Embedding (GSE)を紹介する。
GSEはシルヴェスター方程式の解を用いて、ネットワーク構造と近傍の近接を1つの表現で捉える。
論文 参考訳(メタデータ) (2022-05-07T04:11:23Z) - Compositionality-Aware Graph2Seq Learning [2.127049691404299]
グラフにおける合成性は、多くの graph2seq タスクの出力シーケンスにおける合成性に関連付けられる。
マルチレベルアテンションプーリング(MLAP)アーキテクチャを採用し、複数のレベルの情報ロケータからグラフ表現を集約する。
MLAPアーキテクチャを持つモデルは、7倍以上のパラメータで従来の最先端モデルより優れていることを示す。
論文 参考訳(メタデータ) (2022-01-28T15:22:39Z) - Hierarchical Graph Networks for 3D Human Pose Estimation [50.600944798627786]
最近の2次元から3次元の人間のポーズ推定は、人間の骨格のトポロジーによって形成されたグラフ構造を利用する傾向がある。
この骨格トポロジーは体の構造を反映するには小さすぎるため、重度の2次元から3次元のあいまいさに悩まされていると我々は主張する。
本稿では,これらの弱点を克服するために,新しいグラフ畳み込みネットワークアーキテクチャである階層グラフネットワークを提案する。
論文 参考訳(メタデータ) (2021-11-23T15:09:03Z) - Structural Adapters in Pretrained Language Models for AMR-to-text
Generation [59.50420985074769]
グラフ構造データからのテキスト生成に関するこれまでの研究は、事前学習言語モデル(plm)に依存している。
グラフ構造をPLMにエンコードするアダプタ法であるStructAdaptを提案する。
論文 参考訳(メタデータ) (2021-03-16T15:06:50Z) - HOSE-Net: Higher Order Structure Embedded Network for Scene Graph
Generation [20.148175528691905]
本稿では,関係の局所的および大域的構造情報を出力空間に組み込むための新しい構造認識型組込み分類器(SEC)モジュールを提案する。
また,高次構造情報を導入して部分空間の数を減らし,階層的セマンティックアグリゲーション(HSA)モジュールを提案する。
提案したHOSE-Netは、Visual GenomeとVRDの2つの人気のあるベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2020-08-12T07:58:13Z) - Learning Graph Structure With A Finite-State Automaton Layer [31.028101360041227]
本研究は,本質的なグラフ構造から抽象的関係を導出する学習の課題について考察する。
この問題を緩和して有限状態オートマトンポリシーを学習することで、これらの関係をエンドツーエンドで学習する方法を示す。
我々は,このレイヤがグリッドワールドグラフのショートカットを見つけ,Pythonプログラム上で単純な静的解析を再現できることを実証した。
論文 参考訳(メタデータ) (2020-07-09T17:01:34Z) - Iterative Context-Aware Graph Inference for Visual Dialog [126.016187323249]
本稿では,新しいコンテキスト認識グラフ(CAG)ニューラルネットワークを提案する。
グラフの各ノードは、オブジェクトベース(視覚)と履歴関連(テキスト)コンテキスト表現の両方を含む、共同意味機能に対応している。
論文 参考訳(メタデータ) (2020-04-05T13:09:37Z) - Hierarchical Human Parsing with Typed Part-Relation Reasoning [179.64978033077222]
このタスクでは、人体構造をモデル化する方法が中心的なテーマである。
深層グラフネットワークの表現能力と階層的人間構造を同時に活用することを模索する。
論文 参考訳(メタデータ) (2020-03-10T16:45:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。