論文の概要: Refinement Module based on Parse Graph of Feature Map for Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2501.11069v2
- Date: Sun, 16 Feb 2025 13:07:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-18 14:04:23.902390
- Title: Refinement Module based on Parse Graph of Feature Map for Human Pose Estimation
- Title(参考訳): 人文推定のための特徴マップのParseグラフに基づくリファインメントモジュール
- Authors: Shibang Liu, Xuemei Xie, Guangming Shi,
- Abstract要約: ヒトの身体のParseグラフは、ヒトのポーズ推定(HPE)を完遂するためにヒトの脳内で得られる。
機能マップのParse Graph(RMPG)に基づいたRefinement Moduleを設計し、トップダウン分解とボトムアップの組み合わせの2段階を含む。
我々のネットワークは、複数の主流の人間のポーズデータセットにおいて優れた結果を得る。
- 参考スコア(独自算出の注目度): 31.603231536312688
- License:
- Abstract: Parse graphs of the human body can be obtained in the human brain to help humans complete the human pose estimation (HPE). It contains a hierarchical structure, like a tree structure, and context relations among nodes. Many researchers predefine the parse graph of body structure to design HPE frameworks. However, these frameworks struggle to adapt to instances that deviate from the predefined parse graph and are often parameter-heavy. Unlike them, we view the feature map holistically, much like the human body. It can be optimized using parse graphs, where each node's feature is an implicit expression rather than a fixed one. This allows it to adapt to more instances, unconstrained by rigid structural features. In this paper, we design the Refinement Module based on the Parse Graph of feature map (RMPG), which includes two stages: top-down decomposition and bottom-up combination. In the first stage, the feature map is decomposed into multiple sub-feature maps along the channel. In the second stage, the context relations of sub-feature maps are calculated to obtain their respective context information and the sub-feature maps with context information are concatenated along channels to obtain the refined feature map. Additionally, we design a hierarchical network with fewer parameters using multiple RMPG modules for HPE according to the parse graph of body structure, some of which are supervised to obtain context relations among body parts. Our network achieves excellent results on multiple mainstream human pose datasets. More importantly, the effectiveness of RMPG is proven on different methods. The code of RMPG will be open.
- Abstract(参考訳): ヒトの身体のParseグラフはヒトの脳内で取得され、ヒトのポーズ推定(HPE)が完成するのを助ける。
木構造のような階層構造とノード間のコンテキスト関係を含む。
多くの研究者は、HPEフレームワークを設計するための体の構造のパースグラフを事前に定義している。
しかしながら、これらのフレームワークは、事前に定義されたパースグラフから逸脱し、しばしばパラメータが重いインスタンスに適応するのに苦労する。
それらとは異なり、私たちは特徴マップを人体とほとんど同じように、全体像的に見る。
パースグラフを使って最適化することが可能で、各ノードの特徴は固定表現ではなく暗黙の表現である。
これにより、厳格な構造的特徴に制約されずに、より多くのインスタンスに適応できる。
本稿では、トップダウン分解とボトムアップ結合の2段階を含む機能マップ(RMPG)のParse Graphに基づいてRefinement Moduleを設計する。
最初の段階では、特徴写像はチャネルに沿って複数のサブフィーチャーマップに分解される。
第2段階では、サブフィーチャーマップのコンテキスト関係を算出してそれぞれのコンテキスト情報を取得し、コンテキスト情報付きサブフィーチャーマップをチャネルに沿って連結して洗練された特徴マップを得る。
さらに,HPEの複数のRMPGモジュールを用いて,より少ないパラメータを持つ階層型ネットワークを設計する。
我々のネットワークは、複数の主流の人間のポーズデータセットにおいて優れた結果を得る。
さらに重要なことは、RMPGの有効性が異なる方法で証明されていることである。
RMPGのコードはオープンになります。
関連論文リスト
- MapTRv2: An End-to-End Framework for Online Vectorized HD Map Construction [40.07726377230152]
High-definition (HD) マップは、運転シーンの豊富な正確な静的環境情報を提供する。
オンラインベクトル化HDマップ構築のためのエンドツーエンドフレームワークである textbfMap textbfTRansformer を提案する。
論文 参考訳(メタデータ) (2023-08-10T17:56:53Z) - Integrating Human Parsing and Pose Network for Human Action Recognition [12.308394270240463]
動作認識のための新しいモダリティとして,人間の解析特徴マップを導入する。
本稿では,行動認識のためのヒューマンパーシングとポースネットワーク(IPP-Net)の統合を提案する。
IPP-Netは、スケルトンと人間のパース機能マップの両方を活用する最初の方法である。
論文 参考訳(メタデータ) (2023-07-16T07:58:29Z) - Learning Implicit Feature Alignment Function for Semantic Segmentation [51.36809814890326]
Implicit Feature Alignment Function (IFA)は、暗黙の神経表現の急速に拡大するトピックにインスパイアされている。
IFAは機能マップを異なるレベルで暗黙的に整列し、任意の解像度でセグメンテーションマップを生成することができることを示す。
提案手法は,様々なアーキテクチャの改善と組み合わせて,一般的なベンチマークにおける最先端の精度のトレードオフを実現する。
論文 参考訳(メタデータ) (2022-06-17T09:40:14Z) - Graph-Based 3D Multi-Person Pose Estimation Using Multi-View Images [79.70127290464514]
我々は,タスクを2つの段階,すなわち人物のローカライゼーションとポーズ推定に分解する。
また,効率的なメッセージパッシングのための3つのタスク固有グラフニューラルネットワークを提案する。
提案手法は,CMU Panoptic と Shelf のデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2021-09-13T11:44:07Z) - Multi-Level Graph Encoding with Structural-Collaborative Relation
Learning for Skeleton-Based Person Re-Identification [11.303008512400893]
Skeletonベースの人物再識別(Re-ID)は、安全クリティカルなアプリケーションに優れた価値を提供する、新たなオープントピックである。
既存の方法は通常、手作りの特徴やモデル骨格のダイナミクスを体関節の軌跡から抽出する。
Re-IDの識別グラフ特徴を符号化するために,構造協調関係学習(MG-SCR)を用いたマルチレベルグラフ符号化手法を提案する。
論文 参考訳(メタデータ) (2021-06-06T09:09:57Z) - Learning Spatial Context with Graph Neural Network for Multi-Person Pose
Grouping [71.59494156155309]
イメージベース多人数ポーズ推定のためのボトムアップ手法は,キーポイント検出とグループ化の2段階からなる。
本研究では,グラフ分割問題としてグループ化タスクを定式化し,グラフニューラルネットワーク(gnn)を用いて親和性行列を学習する。
学習された幾何学に基づく親和性は、強固なキーポイント結合を達成するために外観に基づく親和性とさらに融合する。
論文 参考訳(メタデータ) (2021-04-06T09:21:14Z) - Hierarchical Graph Capsule Network [78.4325268572233]
ノード埋め込みを共同で学習し,グラフ階層を抽出できる階層型グラフカプセルネットワーク(HGCN)を提案する。
階層的表現を学ぶために、HGCNは下層カプセル(部分)と高層カプセル(全体)の間の部分的関係を特徴付ける。
論文 参考訳(メタデータ) (2020-12-16T04:13:26Z) - Graph-PCNN: Two Stage Human Pose Estimation with Graph Pose Refinement [54.29252286561449]
グラフPCNNと呼ばれる2段階のグラフベースおよびモデルに依存しないフレームワークを提案する。
第1段階では、粗局化結果を得るために熱マップ回帰ネットワークを適用し、ガイドポイントと呼ばれる一連の提案キーポイントをサンプリングする。
第2段階では、各案内点について、ローカライゼーションにより異なる視覚特徴を抽出する。
ガイドされた点間の関係は、より正確なローカライゼーション結果を得るためにグラフポーズ精製モジュールによって探索される。
論文 参考訳(メタデータ) (2020-07-21T04:59:15Z) - Hierarchical Human Parsing with Typed Part-Relation Reasoning [179.64978033077222]
このタスクでは、人体構造をモデル化する方法が中心的なテーマである。
深層グラフネットワークの表現能力と階層的人間構造を同時に活用することを模索する。
論文 参考訳(メタデータ) (2020-03-10T16:45:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。