Fugu-MT 論文翻訳(概要): Refinement Module based on Parse Graph of Feature Map for Human Pose Estimation

論文の概要: Refinement Module based on Parse Graph of Feature Map for Human Pose Estimation

arxiv url: http://arxiv.org/abs/2501.11069v4
Date: Thu, 13 Mar 2025 02:41:37 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-14 17:08:08.184287
Title: Refinement Module based on Parse Graph of Feature Map for Human Pose Estimation
Title（参考訳）: 人文推定のための特徴マップのParseグラフに基づくリファインメントモジュール
Authors: Shibang Liu, Xuemei Xie, Guangming Shi,
Abstract要約: 人体のParseグラフは、人間のPose Estimationをより良く完成させるのに役立つ。機能マップのParse Graph(RMPG)に基づいたRefinement Moduleを設計し、トップダウン分解とボトムアップの組み合わせの2段階を含む。我々のネットワークは、複数の主流の人間のポーズデータセットにおいて優れた結果を得る。
参考スコア（独自算出の注目度）: 31.603231536312688
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Parse graphs of the human body can be obtained in the human brain to help humans complete the human Pose Estimation better (HPE). It contains a hierarchical structure, like a tree structure, and context relations among nodes. To equip models with such capabilities, many researchers predefine the parse graph of body structure to design HPE frameworks. However, these frameworks struggle to adapt to instances that deviate from the predefined parse graph and they are often parameter-heavy. Unlike them, we view the feature map holistically, much like the human body. It can be optimized using parse graphs, where nodes' implicit feature representation boosts adaptability, avoiding rigid structural limitations. In this paper, we design the Refinement Module based on the Parse Graph of feature map (RMPG), which includes two stages: top-down decomposition and bottom-up combination. In the first stage, the feature map is constructed into a tree structure through recursive decomposition, with each node representing a sub-feature map, thereby achieving hierarchical modeling of features. In the second stage, context information is calculated and sub-feature maps with context are recursively connected to gradually build a refined feature map. Additionally, we design a hierarchical network with fewer parameters using multiple RMPG modules to model the context relations and hierarchies in the parse graph of body structure for HPE, some of which are supervised to obtain context relations among body parts. Our network achieves excellent results on multiple mainstream human pose datasets and the effectiveness of RMPG is proven on different methods. The code of RMPG will be open.
Abstract（参考訳）: 人体のParseグラフはヒトの脳内で取得され、ヒトのPose Estimation Better(HPE)の完成を支援する。木構造のような階層構造とノード間のコンテキスト関係を含む。このような能力をモデルに装備するために、多くの研究者がHPEフレームワークを設計するためにボディ構造のパースグラフを事前に定義している。しかしながら、これらのフレームワークは、事前に定義されたパースグラフから逸脱するインスタンスに適応するのに苦労し、しばしばパラメータが重い。それらとは異なり、私たちは特徴マップを人体とほとんど同じように、全体像的に見る。ノードの暗黙的な特徴表現が適応性を高め、厳密な構造的制限を回避するために、パースグラフを使って最適化することができる。本稿では、トップダウン分解とボトムアップ結合の2段階を含む機能マップ(RMPG)のParse Graphに基づいてRefinement Moduleを設計する。最初の段階では、特徴写像は再帰分解によって木構造に構築され、各ノードはサブフィーチャーマップを表し、特徴の階層的モデリングを実現する。第2段階では、コンテキスト情報が計算され、コンテキスト付きサブフィーチャーマップが再帰的に接続され、徐々に洗練された特徴マップが構築される。さらに、複数のRMPGモジュールを用いて、HPEのボディ構造解析グラフのコンテキスト関係と階層をモデル化する階層ネットワークを設計する。我々のネットワークは、複数の主流人のポーズデータセットにおいて優れた結果が得られ、RMPGの有効性は異なる手法で証明される。 RMPGのコードはオープンになります。

関連論文リスト

MDL-Pool: Adaptive Multilevel Graph Pooling Based on Minimum Description Length [0.716879432974126]
グラフプーリングはグラフを圧縮し、その位相的性質とベクトル表現の特徴を要約する。カレントアプローチは、浅いプール作用素を固定深さまで反復的に適用することでグラフの階層構造をプールする。最小記述長(MDL)の原理に基づくプール演算子 MDL-Pool を提案する。
論文参考訳（メタデータ） (2024-09-16T13:13:15Z)
MapTRv2: An End-to-End Framework for Online Vectorized HD Map Construction [40.07726377230152]
High-definition (HD) マップは、運転シーンの豊富な正確な静的環境情報を提供する。オンラインベクトル化HDマップ構築のためのエンドツーエンドフレームワークである textbfMap textbfTRansformer を提案する。
論文参考訳（メタデータ） (2023-08-10T17:56:53Z)
Integrating Human Parsing and Pose Network for Human Action Recognition [12.308394270240463]
動作認識のための新しいモダリティとして,人間の解析特徴マップを導入する。本稿では,行動認識のためのヒューマンパーシングとポースネットワーク(IPP-Net)の統合を提案する。 IPP-Netは、スケルトンと人間のパース機能マップの両方を活用する最初の方法である。
論文参考訳（メタデータ） (2023-07-16T07:58:29Z)
DepGraph: Towards Any Structural Pruning [68.40343338847664]
我々は、CNN、RNN、GNN、Transformersのような任意のアーキテクチャの一般的な構造解析について研究する。本稿では,階層間の依存関係を明示的にモデル化し,包括的にグループ化してプルーニングを行う汎用かつ完全自動な手法であるemphDependency Graph(DepGraph)を提案する。本研究では,画像用ResNe(X)t,DenseNet,MobileNet,Vision Transformer,グラフ用GAT,3Dポイントクラウド用DGCNN,言語用LSTMなど,さまざまなアーキテクチャやタスクに関する手法を広範囲に評価し,言語用LSTMと並行して示す。
論文参考訳（メタデータ） (2023-01-30T14:02:33Z)
GrannGAN: Graph annotation generative adversarial networks [72.66289932625742]
本稿では,高次元分布をモデル化し,グラフスケルトンと整合した複雑な関係特徴構造を持つデータの新しい例を生成することの問題点を考察する。提案するモデルは,タスクを2つのフェーズに分割することで,各データポイントのグラフ構造に制約されたデータ特徴を生成する問題に対処する。第一に、与えられたグラフのノードに関連する機能の分布をモデル化し、第二に、ノードのフィーチャに条件付きでエッジ機能を補完する。
論文参考訳（メタデータ） (2022-12-01T11:49:07Z)
SPGP: Structure Prototype Guided Graph Pooling [1.3764085113103217]
グラフレベルの表現を学習するための構造プロトタイプガイドプーリング(SPGP)を提案する。 SPGPはグラフ構造を学習可能なプロトタイプベクトルとして定式化し、ノードとプロトタイプベクトル間の親和性を計算する。実験の結果,SPGPはグラフ分類ベンチマークデータセットにおいて,最先端のグラフプーリング手法よりも優れていた。
論文参考訳（メタデータ） (2022-09-16T09:33:09Z)
Motif-based Graph Representation Learning with Application to Chemical Molecules [11.257235936629689]
既存のグラフニューラルネットワークは、局所的な構造的コンテキスト内で複雑な相互作用をキャプチャする限られた能力を提供する。局所構造情報をよりよく活用するためのモチーフに基づくグラフ表現学習手法を提案する。 MCMは、教師なしの方法でモチーフ語彙を構築し、新しいモチーフ畳み込み操作を展開し、局所構造コンテキストを抽出する。
論文参考訳（メタデータ） (2022-08-09T03:37:37Z)
Learning Implicit Feature Alignment Function for Semantic Segmentation [51.36809814890326]
Implicit Feature Alignment Function (IFA)は、暗黙の神経表現の急速に拡大するトピックにインスパイアされている。 IFAは機能マップを異なるレベルで暗黙的に整列し、任意の解像度でセグメンテーションマップを生成することができることを示す。提案手法は,様々なアーキテクチャの改善と組み合わせて,一般的なベンチマークにおける最先端の精度のトレードオフを実現する。
論文参考訳（メタデータ） (2022-06-17T09:40:14Z)
Graph Spectral Embedding using the Geodesic Betweeness Centrality [76.27138343125985]
本稿では、局所的な類似性、接続性、グローバル構造を教師なしで表現するグラフSylvester Embedding (GSE)を紹介する。 GSEはシルヴェスター方程式の解を用いて、ネットワーク構造と近傍の近接を1つの表現で捉える。
論文参考訳（メタデータ） (2022-05-07T04:11:23Z)
GraphDCA -- a Framework for Node Distribution Comparison in Real and Synthetic Graphs [72.51835626235368]
2つのグラフを比較するとき、ノード構造的特徴の分布は、グローバルグラフ統計よりも有益である、と我々は主張する。本稿では,各ノード表現セットのアライメントに基づいてグラフ間の類似性を評価するフレームワークGraphDCAを提案する。
論文参考訳（メタデータ） (2022-02-08T14:19:19Z)
Compositionality-Aware Graph2Seq Learning [2.127049691404299]
グラフにおける合成性は、多くの graph2seq タスクの出力シーケンスにおける合成性に関連付けられる。マルチレベルアテンションプーリング(MLAP)アーキテクチャを採用し、複数のレベルの情報ロケータからグラフ表現を集約する。 MLAPアーキテクチャを持つモデルは、7倍以上のパラメータで従来の最先端モデルより優れていることを示す。
論文参考訳（メタデータ） (2022-01-28T15:22:39Z)
Hierarchical Graph Networks for 3D Human Pose Estimation [50.600944798627786]
最近の2次元から3次元の人間のポーズ推定は、人間の骨格のトポロジーによって形成されたグラフ構造を利用する傾向がある。この骨格トポロジーは体の構造を反映するには小さすぎるため、重度の2次元から3次元のあいまいさに悩まされていると我々は主張する。本稿では,これらの弱点を克服するために,新しいグラフ畳み込みネットワークアーキテクチャである階層グラフネットワークを提案する。
論文参考訳（メタデータ） (2021-11-23T15:09:03Z)
Multi-Scale Semantics-Guided Neural Networks for Efficient Skeleton-Based Human Action Recognition [140.18376685167857]
スケルトンに基づく行動認識には,単純なマルチスケールセマンティクス誘導ニューラルネットワークが提案されている。 MS-SGNは、NTU60、NTU120、SYSUデータセットの最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2021-11-07T03:50:50Z)
HRKD: Hierarchical Relational Knowledge Distillation for Cross-domain Language Model Compression [53.90578309960526]
大規模事前学習言語モデル(PLM)は、従来のニューラルネットワーク手法と比較して圧倒的な性能を示している。階層的および領域的関係情報の両方を抽出する階層的関係知識蒸留法(HRKD)を提案する。
論文参考訳（メタデータ） (2021-10-16T11:23:02Z)
Graph-Based 3D Multi-Person Pose Estimation Using Multi-View Images [79.70127290464514]
我々は,タスクを2つの段階,すなわち人物のローカライゼーションとポーズ推定に分解する。また,効率的なメッセージパッシングのための3つのタスク固有グラフニューラルネットワークを提案する。提案手法は,CMU Panoptic と Shelf のデータセット上での最先端性能を実現する。
論文参考訳（メタデータ） (2021-09-13T11:44:07Z)
Tree Decomposition Attention for AMR-to-Text Generation [12.342043849587613]
グラフ内の自己注意を制限するために、グラフのツリー分解を使用します。動的プログラミングを用いて木分解の森を導出し、AMRと最も構造的に類似した木を選択する。我々のシステムは1.6BLEUと1.8chrF++の自励ベースラインを上回ります。
論文参考訳（メタデータ） (2021-08-27T14:24:25Z)
Multi-Level Graph Encoding with Structural-Collaborative Relation Learning for Skeleton-Based Person Re-Identification [11.303008512400893]
Skeletonベースの人物再識別(Re-ID)は、安全クリティカルなアプリケーションに優れた価値を提供する、新たなオープントピックである。既存の方法は通常、手作りの特徴やモデル骨格のダイナミクスを体関節の軌跡から抽出する。 Re-IDの識別グラフ特徴を符号化するために,構造協調関係学習(MG-SCR)を用いたマルチレベルグラフ符号化手法を提案する。
論文参考訳（メタデータ） (2021-06-06T09:09:57Z)
Learning Spatial Context with Graph Neural Network for Multi-Person Pose Grouping [71.59494156155309]
イメージベース多人数ポーズ推定のためのボトムアップ手法は,キーポイント検出とグループ化の2段階からなる。本研究では,グラフ分割問題としてグループ化タスクを定式化し,グラフニューラルネットワーク(gnn)を用いて親和性行列を学習する。学習された幾何学に基づく親和性は、強固なキーポイント結合を達成するために外観に基づく親和性とさらに融合する。
論文参考訳（メタデータ） (2021-04-06T09:21:14Z)
Structural Adapters in Pretrained Language Models for AMR-to-text Generation [59.50420985074769]
グラフ構造データからのテキスト生成に関するこれまでの研究は、事前学習言語モデル(plm)に依存している。グラフ構造をPLMにエンコードするアダプタ法であるStructAdaptを提案する。
論文参考訳（メタデータ） (2021-03-16T15:06:50Z)
Accurate Learning of Graph Representations with Graph Multiset Pooling [45.72542969364438]
本稿では,その構造的依存関係に応じてノード間の相互作用をキャプチャするグラフマルチセットトランス (GMT) を提案する。実験の結果,GMTはグラフ分類ベンチマークにおいて,最先端のグラフプーリング法を著しく上回っていることがわかった。
論文参考訳（メタデータ） (2021-02-23T07:45:58Z)
Hierarchical Graph Capsule Network [78.4325268572233]
ノード埋め込みを共同で学習し,グラフ階層を抽出できる階層型グラフカプセルネットワーク(HGCN)を提案する。階層的表現を学ぶために、HGCNは下層カプセル(部分)と高層カプセル(全体)の間の部分的関係を特徴付ける。
論文参考訳（メタデータ） (2020-12-16T04:13:26Z)
HOSE-Net: Higher Order Structure Embedded Network for Scene Graph Generation [20.148175528691905]
本稿では,関係の局所的および大域的構造情報を出力空間に組み込むための新しい構造認識型組込み分類器(SEC)モジュールを提案する。また,高次構造情報を導入して部分空間の数を減らし,階層的セマンティックアグリゲーション(HSA)モジュールを提案する。提案したHOSE-Netは、Visual GenomeとVRDの2つの人気のあるベンチマークで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2020-08-12T07:58:13Z)
Graph-PCNN: Two Stage Human Pose Estimation with Graph Pose Refinement [54.29252286561449]
グラフPCNNと呼ばれる2段階のグラフベースおよびモデルに依存しないフレームワークを提案する。第1段階では、粗局化結果を得るために熱マップ回帰ネットワークを適用し、ガイドポイントと呼ばれる一連の提案キーポイントをサンプリングする。第2段階では、各案内点について、ローカライゼーションにより異なる視覚特徴を抽出する。ガイドされた点間の関係は、より正確なローカライゼーション結果を得るためにグラフポーズ精製モジュールによって探索される。
論文参考訳（メタデータ） (2020-07-21T04:59:15Z)
Graph Neural Networks with Composite Kernels [60.81504431653264]
カーネル重み付けの観点からノード集約を再解釈する。本稿では,アグリゲーション方式における特徴類似性を考慮したフレームワークを提案する。特徴空間における特徴類似性をエンコードするために,元の隣り合うカーネルと学習可能なカーネルの合成として特徴集約を提案する。
論文参考訳（メタデータ） (2020-05-16T04:44:29Z)
Iterative Context-Aware Graph Inference for Visual Dialog [126.016187323249]
本稿では,新しいコンテキスト認識グラフ(CAG)ニューラルネットワークを提案する。グラフの各ノードは、オブジェクトベース(視覚)と履歴関連(テキスト)コンテキスト表現の両方を含む、共同意味機能に対応している。
論文参考訳（メタデータ） (2020-04-05T13:09:37Z)
Hierarchical Human Parsing with Typed Part-Relation Reasoning [179.64978033077222]
このタスクでは、人体構造をモデル化する方法が中心的なテーマである。深層グラフネットワークの表現能力と階層的人間構造を同時に活用することを模索する。
論文参考訳（メタデータ） (2020-03-10T16:45:41Z)
Shift Aggregate Extract Networks [3.3263205689999453]
大規模グラフの効率的な表現を学習するために,階層分解に基づくアーキテクチャを導入する。我々のフレームワークは、カーネルメソッドで使用される古典的なR分解を拡張し、ネストした部分関係を可能にする。我々は,我々のアプローチが,大規模ソーシャルネットワークデータセット上で現在最先端のグラフ分類手法より優れていることを実証的に示す。
論文参考訳（メタデータ） (2017-03-16T09:52:48Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。