Fugu-MT 論文翻訳(概要): Graph Stacked Hourglass Networks for 3D Human Pose Estimation

論文の概要: Graph Stacked Hourglass Networks for 3D Human Pose Estimation

arxiv url: http://arxiv.org/abs/2103.16385v1
Date: Tue, 30 Mar 2021 14:25:43 GMT
ステータス: 翻訳完了
システム内更新日: 2021-03-31 14:52:08.060143
Title: Graph Stacked Hourglass Networks for 3D Human Pose Estimation
Title（参考訳）: 3次元ポーズ推定のためのグラフ重ね合わせ砂時計ネットワーク
Authors: Tianhan Xu, Wataru Takano
Abstract要約: 2次元から3次元のポーズ推定タスクのための新しいグラフ畳み込みネットワークアーキテクチャであるgraph stacked hourglass networkを提案する。提案アーキテクチャは,人間の骨格表現の3つの異なるスケールでグラフ構造化特徴を処理した繰り返しエンコーダデコーダで構成されている。
参考スコア（独自算出の注目度）: 1.0660480034605242
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In this paper, we propose a novel graph convolutional network architecture, Graph Stacked Hourglass Networks, for 2D-to-3D human pose estimation tasks. The proposed architecture consists of repeated encoder-decoder, in which graph-structured features are processed across three different scales of human skeletal representations. This multi-scale architecture enables the model to learn both local and global feature representations, which are critical for 3D human pose estimation. We also introduce a multi-level feature learning approach using different-depth intermediate features and show the performance improvements that result from exploiting multi-scale, multi-level feature representations. Extensive experiments are conducted to validate our approach, and the results show that our model outperforms the state-of-the-art.
Abstract（参考訳）: 本稿では,2次元から3次元の人間のポーズ推定のための新しいグラフ畳み込みネットワークアーキテクチャであるグラフ重畳ホアーグラスネットワークを提案する。提案アーキテクチャは,人間の骨格表現の3つの異なるスケールでグラフ構造化特徴を処理した繰り返しエンコーダデコーダで構成されている。このマルチスケールアーキテクチャにより、モデルは3次元の人間のポーズ推定に不可欠な局所的特徴表現と大域的特徴表現の両方を学ぶことができる。また,異なる詳細な中間機能を用いたマルチレベル特徴学習手法を導入し,マルチスケール・マルチレベル特徴表現の活用による性能改善を示す。我々のアプローチを検証するために広範な実験が行われ、その結果、我々のモデルが最先端を上回っていることが判明した。

関連論文リスト

SAM 3D Body: Robust Full-Body Human Mesh Recovery [65.0108906331903]
シングルイメージフルボディ3Dヒューマンメッシュリカバリ(HMR)のためのアクセラブルモデルSAM 3D Body (3DB)を紹介する。 3DBは、身体、足、手の人間のポーズを推定します。骨格構造と表面形状を分離する新しいパラメトリックメッシュ表現であるMomentum Human Rig(MHR)を使用した最初のモデルである。
論文参考訳（メタデータ） (2026-02-17T20:26:37Z)
MoRE: 3D Visual Geometry Reconstruction Meets Mixture-of-Experts [50.37005070020306]
MoREは、Mixture-of-Experts (MoE)アーキテクチャに基づいた、密集した3Dビジュアル基盤モデルである。 MoREは、幾何推定を安定させ、洗練する信頼に基づく深度補正モジュールを組み込んでいる。高忠実な表面正規予測のために,高密度なセマンティック特徴とグローバルな3Dバックボーン表現を統合する。
論文参考訳（メタデータ） (2025-10-31T06:54:27Z)
Hierarchical Neural Semantic Representation for 3D Semantic Correspondence [72.8101601086805]
階層型ニューラルセマンティック表現(HNSR)を設計し,高次構造と多分解能局所幾何学的特徴を捉える。第2に,グローバルなセマンティック特徴を用いた粗いセマンティック対応を確立する,プログレッシブなグローバル-ローカルマッチング戦略を設計する。第3に,本フレームワークはトレーニングフリーで,様々なトレーニング済みの3D生成バックボーンと広範囲に互換性があり,多様な形状カテゴリにまたがる強力な一般化が示されている。
論文参考訳（メタデータ） (2025-09-22T07:23:07Z)
Hierarchical MLANet: Multi-level Attention for 3D Face Reconstruction From Single Images [0.0]
そこで本研究では,単一の画像から3次元顔モデルを再構成するための畳み込みニューラルネットワークによるアプローチを提案する。本モデルでは, 顔形状, テクスチャ, ポーズ, 照明パラメータを1つの画像から予測する。 3D Morphable Model (3DMM)パラメータを公開データセットから組み込んだ半教師付きトレーニング戦略が採用されている。
論文参考訳（メタデータ） (2025-09-12T07:42:27Z)
A Lesson in Splats: Teacher-Guided Diffusion for 3D Gaussian Splats Generation with 2D Supervision [65.33043028101471]
本研究では,ガウスプレートの拡散モデルであるSplatDiffusionを導入し,単一画像から3次元構造を生成する。既存の方法は決定論的フィードフォワード予測に依存しており、2Dデータからの3D推論の本質的な曖昧さを扱う能力を制限する。
論文参考訳（メタデータ） (2024-12-01T00:29:57Z)
Implicit-Zoo: A Large-Scale Dataset of Neural Implicit Functions for 2D Images and 3D Scenes [65.22070581594426]
Implicit-Zoo"は、この分野の研究と開発を容易にするために、数千のGPUトレーニング日を必要とする大規模なデータセットである。 1)トランスモデルのトークン位置を学習すること、(2)NeRFモデルに関して直接3Dカメラが2D画像のポーズを取ること、である。これにより、画像分類、セマンティックセグメンテーション、および3次元ポーズ回帰の3つのタスクすべてのパフォーマンスが向上し、研究のための新たな道が開けることになる。
論文参考訳（メタデータ） (2024-06-25T10:20:44Z)
Multi-hop graph transformer network for 3D human pose estimation [4.696083734269233]
本稿では,2次元から3次元の人間のポーズ推定を目的としたマルチホップグラフトランスフォーマーネットワークを提案する。提案するネットワークアーキテクチャは,多頭部自己注意層と学習可能な隣接行列を用いたグラフ畳み込みからなるグラフアテンションブロックで構成されている。拡張畳み込み層の統合により、人体関節の正確な位置決めに必要な空間的一般化を扱う能力が向上する。
論文参考訳（メタデータ） (2024-05-05T21:29:20Z)
Hierarchical Graph Networks for 3D Human Pose Estimation [50.600944798627786]
最近の2次元から3次元の人間のポーズ推定は、人間の骨格のトポロジーによって形成されたグラフ構造を利用する傾向がある。この骨格トポロジーは体の構造を反映するには小さすぎるため、重度の2次元から3次元のあいまいさに悩まされていると我々は主張する。本稿では,これらの弱点を克服するために,新しいグラフ畳み込みネットワークアーキテクチャである階層グラフネットワークを提案する。
論文参考訳（メタデータ） (2021-11-23T15:09:03Z)
Higher-Order Implicit Fairing Networks for 3D Human Pose Estimation [1.1501261942096426]
2次元から3次元のポーズ推定のための初期残差接続を持つ高階グラフ畳み込みフレームワークを提案する。我々のモデルは、体節間の長距離依存関係を捉えることができる。 2つの標準ベンチマークで行った実験と改善研究は、我々のモデルの有効性を実証した。
論文参考訳（メタデータ） (2021-11-01T13:48:55Z)
Graph-Based 3D Multi-Person Pose Estimation Using Multi-View Images [79.70127290464514]
我々は,タスクを2つの段階,すなわち人物のローカライゼーションとポーズ推定に分解する。また,効率的なメッセージパッシングのための3つのタスク固有グラフニューラルネットワークを提案する。提案手法は,CMU Panoptic と Shelf のデータセット上での最先端性能を実現する。
論文参考訳（メタデータ） (2021-09-13T11:44:07Z)
Auto-MVCNN: Neural Architecture Search for Multi-view 3D Shape Recognition [16.13826056628379]
3Dシェイプ認識では、人間の視点を活かして3Dシェイプを解析し、大きな成果を上げています。マルチビュー3D形状認識におけるアーキテクチャを最適化するために特に設計された,Auto-MVCNNというニューラルアーキテクチャ検索手法を提案する。
論文参考訳（メタデータ） (2020-12-10T07:40:28Z)
Unsupervised Cross-Modal Alignment for Multi-Person 3D Pose Estimation [52.94078950641959]
マルチパーソン・ヒューマン・ポーズ推定のためのデプロイフレンドリーで高速なボトムアップ・フレームワークを提案する。我々は,人物の位置を対応する3Dポーズ表現と統一する,多人数の3Dポーズのニューラル表現を採用する。ペア化された2Dまたは3Dポーズアノテーションが利用できない実用的な配置パラダイムを提案する。
論文参考訳（メタデータ） (2020-08-04T07:54:25Z)
HMOR: Hierarchical Multi-Person Ordinal Relations for Monocular Multi-Person 3D Pose Estimation [54.23770284299979]
本稿では, 階層型多人数常連関係(HMOR)を新たに導入する。 HMORは相互作用情報を階層的に深さと角度の順序関係として符号化する。統合トップダウンモデルは、学習プロセスにおけるこれらの順序関係を活用するように設計されている。提案手法は, 公開されている多人数の3Dポーズデータセットにおいて, 最先端の手法を著しく上回っている。
論文参考訳（メタデータ） (2020-08-01T07:53:27Z)
Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image Synthesis [72.34794624243281]
ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。 3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
論文参考訳（メタデータ） (2020-04-09T07:55:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。