Fugu-MT 論文翻訳(概要): PoseGRAF: Geometric-Reinforced Adaptive Fusion for Monocular 3D Human Pose Estimation

論文の概要: PoseGRAF: Geometric-Reinforced Adaptive Fusion for Monocular 3D Human Pose Estimation

arxiv url: http://arxiv.org/abs/2506.14596v1
Date: Tue, 17 Jun 2025 14:59:56 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-18 17:34:59.532359
Title: PoseGRAF: Geometric-Reinforced Adaptive Fusion for Monocular 3D Human Pose Estimation
Title（参考訳）: PoseGRAF: 幾何学的強化型適応核融合による単眼的3次元姿勢推定
Authors: Ming Xu, Xu Zhang,
Abstract要約: 既存の単眼的な3次元ポーズ推定法は, 骨格の内在方向と角方向の相関性を見越しながら, 関節位置の特徴に依存している。これらの課題に対処するためのPoseGRAFフレームワークを提案する。 Human3.6M と MPI-INF-3DHP のデータセットによる実験結果から,本手法が最先端の手法を超えることが示された。
参考スコア（独自算出の注目度）: 5.223657684081615
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Existing monocular 3D pose estimation methods primarily rely on joint positional features, while overlooking intrinsic directional and angular correlations within the skeleton. As a result, they often produce implausible poses under joint occlusions or rapid motion changes. To address these challenges, we propose the PoseGRAF framework. We first construct a dual graph convolutional structure that separately processes joint and bone graphs, effectively capturing their local dependencies. A Cross-Attention module is then introduced to model interdependencies between bone directions and joint features. Building upon this, a dynamic fusion module is designed to adaptively integrate both feature types by leveraging the relational dependencies between joints and bones. An improved Transformer encoder is further incorporated in a residual manner to generate the final output. Experimental results on the Human3.6M and MPI-INF-3DHP datasets show that our method exceeds state-of-the-art approaches. Additional evaluations on in-the-wild videos further validate its generalizability. The code is publicly available at https://github.com/iCityLab/PoseGRAF.
Abstract（参考訳）: 既存のモノクル3次元ポーズ推定法は主に関節位置の特徴に依存し、骨格内の内在的な方向と角の相関を見渡す。結果として、関節閉塞や急激な動きの変化の下では、しばしば不可解なポーズが生じる。これらの課題に対処するため,我々はPoseGRAFフレームワークを提案する。まず、関節グラフと骨グラフを別々に処理し、その局所的な依存関係を効果的に把握する二重グラフ畳み込み構造を構築する。次に、骨方向と関節の特徴の相互依存性をモデル化するために、クロスアテンションモジュールが導入された。これに基づいて、動的融合モジュールは、関節と骨の間の関係性を利用して、両方の特徴タイプを適応的に統合するように設計されている。改良されたTransformerエンコーダを残留的に組み込んで最終出力を生成する。 Human3.6M と MPI-INF-3DHP のデータセットによる実験結果から,本手法が最先端の手法を超えることが示された。 in-the-wildビデオのさらなる評価は、その一般化可能性をさらに検証する。コードはhttps://github.com/iCityLab/PoseGRAFで公開されている。

関連論文リスト

3D Human Pose Estimation via Spatial Graph Order Attention and Temporal Body Aware Transformer [5.303583360581161]
本稿では,GCNのグラフモデリング機能を利用して,各スケルトンを異なる順序の複数のグラフで表現する手法を提案する。提案した時間的ボディアウェア変換器を用いてシーケンスの空間的特徴を処理する。 Human3.6m, MPIINF-3DHP, HumanEva-Iデータセットを用いた実験により, 提案手法の有効性が示された。
論文参考訳（メタデータ） (2025-05-02T04:58:04Z)
SkelFormer: Markerless 3D Pose and Shape Estimation using Skeletal Transformers [57.46911575980854]
マルチビュー人間のポーズと形状推定のための新しいマーカーレスモーションキャプチャパイプラインであるSkelFormerを紹介する。提案手法は,まず市販の2次元キーポイント推定器を用いて,大規模インザミルドデータに基づいて事前トレーニングを行い,3次元関節位置を求める。次に、重雑音観測から、関節の位置をポーズと形状の表現にマッピングする回帰に基づく逆運動性骨格変換器を設計する。
論文参考訳（メタデータ） (2024-04-19T04:51:18Z)
Spatio-temporal MLP-graph network for 3D human pose estimation [8.267311047244881]
グラフ畳み込みネットワークとその変種は3次元人間のポーズ推定において大きな可能性を示している。暗黙の伝搬フェアリングを用いたグラフフィルタリングにより得られる新しい重み付きヤコビ特徴則を導入する。また, 関節間の関係を学習するために, 隣接変調を用いた。
論文参考訳（メタデータ） (2023-08-29T14:00:55Z)
PoseGraphNet++: Enriching 3D Human Pose with Orientation Estimation [43.261111977510105]
既存の骨格に基づく人間のポーズ推定法は関節位置のみを予測する。本稿では,新しい2D-to-3Dリフトグラフ畳み込みネットワークPoseGraphNet++を提案する。
論文参考訳（メタデータ） (2023-08-22T13:42:15Z)
Iterative Graph Filtering Network for 3D Human Pose Estimation [5.177947445379688]
グラフ畳み込みネットワーク(GCN)は3次元人間のポーズ推定に有効な手法であることが証明されている。本稿では,3次元ポーズ推定のための反復グラフフィルタリングフレームワークを提案する。我々のアプローチは、ラプラシア正規化によるグラフフィルタリングを反復的に解くという考え方に基づいている。
論文参考訳（メタデータ） (2023-07-29T20:46:44Z)
Shuffled Autoregression For Motion Interpolation [53.61556200049156]
この作業は、モーションタスクのためのディープラーニングソリューションを提供することを目的としている。本稿では,自己回帰を任意の(シャッフルされた)順序で生成するために拡張する,emphShuffled AutoRegressionと呼ばれる新しいフレームワークを提案する。また,3つのステージを終端から終端の時空間運動変換器に組み込んだ依存グラフの構築手法を提案する。
論文参考訳（メタデータ） (2023-06-10T07:14:59Z)
(Fusionformer):Exploiting the Joint Motion Synergy with Fusion Network Based On Transformer for 3D Human Pose Estimation [1.52292571922932]
多くの従来手法では、局所的な関節情報の理解が欠けていた。提案手法では,グローバル・テンポラル・セルフ・トラジェクトリ・モジュールとクロス・テンポラル・セルフ・トラジェクトリ・モジュールを導入する。その結果、Human3.6Mデータセットでは2.4%のMPJPEと4.3%のP-MPJPEが改善された。
論文参考訳（メタデータ） (2022-10-08T12:22:10Z)
CrossFormer: Cross Spatio-Temporal Transformer for 3D Human Pose Estimation [24.08170512746056]
3次元人間のポーズ推定は、身体部分間の幾何学的依存関係を符号化し、運動的制約を強制することによって行うことができる。最近のTransformerは、空間領域と時間領域における関節間の長距離依存関係を符号化するために採用されている。フレーム間の微妙な変化を捉えるのに重要な身体関節の豊かな表現を特徴とする新しいポーズ推定変換器を提案する。
論文参考訳（メタデータ） (2022-03-24T23:40:11Z)
MixSTE: Seq2seq Mixed Spatio-Temporal Encoder for 3D Human Pose Estimation in Video [75.23812405203778]
近年, 学習時間相関のため, 全フレームのボディジョイントを世界規模で考慮し, 2次元キーポイントシーケンスから3次元人間のポーズを推定する手法が提案されている。本研究では,各関節の時間的動きを別々にモデル化する時間的変圧器ブロックと,関節間空間相関を有する変圧器ブロックを有するミキシングミキシングを提案する。さらに、ネットワーク出力は、中央フレームから入力ビデオの全フレームに拡張され、入力と出力のベンチマーク間のコヒーレンスが改善される。
論文参考訳（メタデータ） (2022-03-02T04:20:59Z)
NeuroMorph: Unsupervised Shape Interpolation and Correspondence in One Go [109.88509362837475]
入力2つの3次元形状を考慮したニューラルネットワークアーキテクチャであるNeuroMorphを提案する。 NeuroMorphはそれらの間のスムーズかつポイントツーポイント対応を生成する。異なる対象カテゴリの非等尺性ペアを含む、さまざまな入力形状に対してうまく機能する。
論文参考訳（メタデータ） (2021-06-17T12:25:44Z)
MotioNet: 3D Human Motion Reconstruction from Monocular Video with Skeleton Consistency [72.82534577726334]
モノクロビデオから3次元人間の骨格の動きを直接再構成するディープニューラルネットワークであるMotioNetを紹介した。本手法は,動作表現を完全かつ一般的に使用するキネマティックスケルトンを直接出力する最初のデータ駆動型手法である。
論文参考訳（メタデータ） (2020-06-22T08:50:09Z)
Learning 3D Human Shape and Pose from Dense Body Parts [117.46290013548533]
本研究では,3次元の人体形状を学習し,身体部分の密接な対応からポーズをとるために,分解・集約ネットワーク(DaNet)を提案する。ローカルストリームからのメッセージは集約され、回転ベースのポーズの堅牢な予測が強化される。提案手法は,Human3.6M,UP3D,COCO,3DPWを含む屋内および実世界のデータセットで検証される。
論文参考訳（メタデータ） (2019-12-31T15:09:51Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。