Fugu-MT 論文翻訳(概要): GraFormer: Graph Convolution Transformer for 3D Pose Estimation

論文の概要: GraFormer: Graph Convolution Transformer for 3D Pose Estimation

arxiv url: http://arxiv.org/abs/2109.08364v1
Date: Fri, 17 Sep 2021 06:00:42 GMT
ステータス: 翻訳完了
システム内更新日: 2021-09-20 14:40:04.601327
Title: GraFormer: Graph Convolution Transformer for 3D Pose Estimation
Title（参考訳）: GraFormer: 3D Pose推定のためのグラフ畳み込み変換器
Authors: Weixi Zhao and Yunjie Tian and Qixiang Ye and Jianbin Jiao and Weiqiang Wang
Abstract要約: GraFormerは3次元ポーズ推定のためのグラフ畳み込みと組み合わせた新しいトランスフォーマーアーキテクチャである。 GraAttentionはグラフ構造情報を弱めることなく、すべての2次元関節が大域的受容界で相互作用することを可能にする。 ChebGConvブロックは2次元関節を高次球で相互作用させ、隠れた暗黙の関係を定式化する。
参考スコア（独自算出の注目度）: 48.59145057033916
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Exploiting relations among 2D joints plays a crucial role yet remains semi-developed in 2D-to-3D pose estimation. To alleviate this issue, we propose GraFormer, a novel transformer architecture combined with graph convolution for 3D pose estimation. The proposed GraFormer comprises two repeatedly stacked core modules, GraAttention and ChebGConv block. GraAttention enables all 2D joints to interact in global receptive field without weakening the graph structure information of joints, which introduces vital features for later modules. Unlike vanilla graph convolutions that only model the apparent relationship of joints, ChebGConv block enables 2D joints to interact in the high-order sphere, which formulates their hidden implicit relations. We empirically show the superiority of GraFormer through conducting extensive experiments across popular benchmarks. Specifically, GraFormer outperforms state of the art on Human3.6M dataset while using 18$\%$ parameters. The code is available at https://github.com/Graformer/GraFormer .
Abstract（参考訳）: 2次元関節間の関係の活用は重要な役割を担っているが、2次元から3次元のポーズ推定において半発達したままである。そこで本稿では, 3次元ポーズ推定のためのグラフ畳み込みを組み合わせた新しいトランスフォーマーであるgraformerを提案する。提案されたGraFormerは、2つの繰り返し積み重ねられたコアモジュール、GraAttentionとChebGConvブロックで構成されている。 GraAttentionは、すべての2次元関節が、後のモジュールに不可欠な特徴をもたらすジョイントのグラフ構造情報を弱めることなく、大域的受容領域で相互作用することができる。接合の明らかな関係をモデル化するバニラグラフの畳み込みとは異なり、ChebGConvブロックは2次元関節を高次球面で相互作用させ、それらの暗黙の関係を定式化する。 GraFormerの優位性を実証的に示すために、人気のあるベンチマークにまたがって広範な実験を行った。具体的には、GraFormerは18$\%$パラメータを使用しながら、Human3.6Mデータセットのテクニックの状態を上回ります。コードはhttps://github.com/graformer/graformerで入手できる。

関連論文リスト

Learning Pyramid-structured Long-range Dependencies for 3D Human Pose Estimation [28.929345360469807]
人間の構造における行動調整は、2次元関節の空間的制約が3次元ポーズを回復するのに不可欠である。長距離の相互依存関係をキャプチャする新しいピラミッドグラフアテンション(PGA)モジュールを提案する。また、軽量なマルチスケールトランスアーキテクチャである3次元ポーズ推定のためのピラミドグラフ変換器(PGFormer)を開発した。
論文参考訳（メタデータ） (2025-06-03T13:21:37Z)
Toward Scene Graph and Layout Guided Complex 3D Scene Generation [31.396230860775415]
Scene GraphとLayout Guided 3D Scene Generation(GraLa3D)の新たなフレームワークを提案する。複雑な3Dシーンを記述するテキストプロンプトが与えられたとき、GraLa3Dはレイアウト境界ボックス情報を持つシーングラフ表現を使用してシーンをモデル化する。 GraLa3Dは、単一オブジェクトノードと複合スーパーノードでシーングラフを独自に構築する。
論文参考訳（メタデータ） (2024-12-29T14:21:03Z)
Feat2GS: Probing Visual Foundation Models with Gaussian Splatting [53.86049874165888]
ビジュアルファウンデーションモデル(VFM)は、広範囲なデータセットでトレーニングされるが、2D画像に制限されることが多い。画像から抽出したVFM特徴から3Dガウス特性を読み取るFeat2GSを紹介する。我々は,複数のVFMの3次元認識を探索する広範囲な実験を行い,VFMの3次元認識に繋がる成分について検討した。
論文参考訳（メタデータ） (2024-12-12T18:59:28Z)
GEAL: Generalizable 3D Affordance Learning with Cross-Modal Consistency [50.11520458252128]
既存の3Dアベイランス学習手法は、注釈付きデータに制限があるため、一般化と堅牢性に苦慮している。本稿では,大規模事前学習型2Dモデルを活用することで,3次元アベイランス学習の一般化と堅牢性を高めるための新しいフレームワークであるGEALを提案する。 GEALは、既存のメソッドと、新しいオブジェクトカテゴリ、および破損したデータにおいて、一貫して優れています。
論文参考訳（メタデータ） (2024-12-12T17:59:03Z)
CompGS: Unleashing 2D Compositionality for Compositional Text-to-3D via Dynamically Optimizing 3D Gaussians [97.15119679296954]
CompGS は 3D Gaussian Splatting (GS) を用いた,効率的なテキストから3Dコンテンツ生成のための新しい生成フレームワークである。 CompGSは簡単に3D編集に拡張でき、シーン生成を容易にする。
論文参考訳（メタデータ） (2024-10-28T04:35:14Z)
Hamba: Single-view 3D Hand Reconstruction with Graph-guided Bi-Scanning Mamba [48.45301469664908]
1枚のRGB画像からの3Dハンド再構成は、関節運動、自己閉塞、物体との相互作用により困難である。既存のSOTA法では、3Dハンドポーズと形状を学ぶためにアテンションベースのトランスフォーマーを採用している。本稿では,グラフ学習と状態空間モデリングを橋渡しするHambaというグラフ誘導型Mambaフレームワークを提案する。
論文参考訳（メタデータ） (2024-07-12T19:04:58Z)
Interactive3D: Create What You Want by Interactive 3D Generation [13.003964182554572]
我々はインタラクティブな3D生成のための革新的なフレームワークであるInteractive3Dを紹介した。実験の結果,Interactive3Dは3D生成の制御性と品質を著しく向上させることがわかった。
論文参考訳（メタデータ） (2024-04-25T11:06:57Z)
PostoMETRO: Pose Token Enhanced Mesh Transformer for Robust 3D Human Mesh Recovery [20.763457281944834]
本稿では,2次元ポーズ表現をトークン的に変換器に統合するPostoMETROを提案する。閉塞のような極端なシナリオの下でも、より正確な3D座標を生成することができます。
論文参考訳（メタデータ） (2024-03-19T06:18:25Z)
MotionAGFormer: Enhancing 3D Human Pose Estimation with a Transformer-GCNFormer Network [2.7268855969580166]
本稿では、2つの並列トランスとGCNFormerストリームを用いてチャネル数を分割する新しいAttention-GCNFormerブロックを提案する。提案するGCNFormerモジュールは, 隣接する接合部間の局所的関係を利用して, トランス出力を補完する新しい表現を出力する。我々は、Human3.6MとMPI-INF-3DHPの2つの人気のあるベンチマークデータセットでモデルを評価する。
論文参考訳（メタデータ） (2023-10-25T01:46:35Z)
Invariant Training 2D-3D Joint Hard Samples for Few-Shot Point Cloud Recognition [108.07591240357306]
我々は,従来の3次元モデルとよく訓練された2次元モデルとの合同予測を用いて,少数の3次元物体の雲認識におけるデータ不足問題に取り組む。異なるラベルに対して高い信頼性の予測を行う'結合型ハードサンプル'のトレーニングは、クラックがより効果的でないことが分かりました。 InvJointと呼ばれる提案した不変トレーニング戦略は、ハードサンプルに重点を置いているだけでなく、矛盾する2Dと3Dの不明瞭な予測の相違も求めている。
論文参考訳（メタデータ） (2023-08-18T17:43:12Z)
MvDeCor: Multi-view Dense Correspondence Learning for Fine-grained 3D Segmentation [91.6658845016214]
そこで本研究では,2次元領域における自己教師型手法を,微細な3次元形状分割作業に活用することを提案する。複数のビューから3次元形状を描画し、コントラスト学習フレームワーク内に密接な対応学習タスクを設置する。その結果、学習された2次元表現はビュー不変であり、幾何学的に一貫性がある。
論文参考訳（メタデータ） (2022-08-18T00:48:15Z)
A hybrid classification-regression approach for 3D hand pose estimation using graph convolutional networks [1.0152838128195467]
目的ごとの関係制約を学習する2段階のGCNベースのフレームワークを提案する。第1フェーズは2D/3D空間を量子化し、その局所性に基づいて関節を2D/3Dブロックに分類する。第2段階ではGCNベースのモジュールを使用し、隣り合う適応アルゴリズムを用いて関節関係を決定する。
論文参考訳（メタデータ） (2021-05-23T10:09:10Z)
Interactive Annotation of 3D Object Geometry using 2D Scribbles [84.51514043814066]
本稿では,ポイントクラウドデータとRGB画像から3次元オブジェクト形状をアノテートする対話型フレームワークを提案する。当社のフレームワークは,芸術的,グラフィック的専門知識のないナイーブユーザを対象としている。
論文参考訳（メタデータ） (2020-08-24T21:51:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。