論文の概要: NeuralAnnot: Neural Annotator for 3D Human Mesh Training Sets
- arxiv url: http://arxiv.org/abs/2011.11232v5
- Date: Tue, 19 Apr 2022 06:04:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-22 02:21:18.540316
- Title: NeuralAnnot: Neural Annotator for 3D Human Mesh Training Sets
- Title(参考訳): Neural Annot: 3次元メッシュトレーニングセットのためのニューラルアノテーション
- Authors: Gyeongsik Moon and Hongsuk Choi and Kyoung Mu Lee
- Abstract要約: ほとんどの3次元メッシュ回帰器は、3次元擬似GT人間のモデルパラメータで制御され、GT 2D/3D関節座標で弱制御される。
ニューラルネットワークベースのアノテータであるNeuralAnnotを紹介する。
NeuralAnnotの3次元擬似GTは回帰器の訓練に非常に有益であることを示す。
- 参考スコア(独自算出の注目度): 70.23652933572647
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most 3D human mesh regressors are fully supervised with 3D pseudo-GT human
model parameters and weakly supervised with GT 2D/3D joint coordinates as the
3D pseudo-GTs bring great performance gain. The 3D pseudo-GTs are obtained by
annotators, systems that iteratively fit 3D human model parameters to GT 2D/3D
joint coordinates of training sets in the pre-processing stage of the
regressors. The fitted 3D parameters at the last fitting iteration become the
3D pseudo-GTs, used to fully supervise the regressors. Optimization-based
annotators, such as SMPLify-X, have been widely used to obtain the 3D
pseudo-GTs. However, they often produce wrong 3D pseudo-GTs as they fit the 3D
parameters to GT of each sample independently. To overcome the limitation, we
present NeuralAnnot, a neural network-based annotator. The main idea of
NeuralAnnot is to employ a neural network-based regressor and dedicate it for
the annotation. Assuming no 3D pseudo-GTs are available, NeuralAnnot is weakly
supervised with GT 2D/3D joint coordinates of training sets. The testing
results on the same training sets become 3D pseudo-GTs, used to fully supervise
the regressors. We show that 3D pseudo-GTs of NeuralAnnot are highly beneficial
to train the regressors. We made our 3D pseudo-GTs publicly available.
- Abstract(参考訳): ほとんどの3次元メッシュ回帰器は、3D擬似GT人間のモデルパラメータで完全に制御されており、3D擬似GTが大きなパフォーマンス向上をもたらすため、GT 2D/3D関節座標で弱制御されている。
3D擬似GTは、アノテータによって取得され、3D人間のモデルパラメータを回帰器の前処理段階におけるトレーニングセットのGT2D/3D関節座標に反復的に適合させるシステムである。
最後に装着された3Dパラメータは、3D擬似GTとなり、後続機を完全に監督するために使用される。
SMPLify-Xのような最適化ベースのアノテータは、3D擬似GTを得るために広く使われている。
しかし、各サンプルの3DパラメータをGTに独立に適合させるため、しばしば間違った3D擬似GTを生成する。
この制限を克服するため、ニューラルネットワークベースのアノテーションであるNeuralAnnotを提案する。
NeuralAnnotの主なアイデアは、ニューラルネットワークベースの回帰器を採用して、アノテーションに捧げることである。
3D擬似GTが存在しないと仮定すると、NeuralAnnotはトレーニングセットのGT 2D/3D共同座標で弱められる。
同じトレーニングセットでの試験結果は、3D擬似GTとなり、回帰器を完全に監督するために使用される。
NeuralAnnotの3次元擬似GTは回帰器の訓練に非常に有益であることを示す。
3D擬似GTを公開しました。
関連論文リスト
- MeshFormer: High-Quality Mesh Generation with 3D-Guided Reconstruction Model [34.245635412589806]
MeshFormerはスパースビューリコンストラクションモデルで、3Dネイティブ構造、入力ガイダンス、トレーニングインスペクションを明示的に活用する。
2次元拡散モデルと統合することで、高速な単一像から3次元およびテキストから3次元のタスクを可能にする。
論文 参考訳(メタデータ) (2024-08-19T17:55:17Z) - GGHead: Fast and Generalizable 3D Gaussian Heads [48.967905053963385]
3D GANは、比較的遅い列車とレンダリング速度のために、高解像度でサンプルを生成するのに苦労しています。
本稿では、3次元GANフレームワーク内での最近の3次元ガウススプラッティング表現を取り入れた生成ガウスヘッド(GGHead)を提案する。
高品質な3Dコンセントヘッドのリアルタイム生成とレンダリングを初めて10242ドルで実証した。
論文 参考訳(メタデータ) (2024-06-13T17:54:38Z) - PonderV2: Pave the Way for 3D Foundation Model with A Universal
Pre-training Paradigm [114.47216525866435]
本稿では,効率的な3D表現の獲得を容易にするために,新しいユニバーサル3D事前学習フレームワークを提案する。
PonderV2は、11の室内および屋外ベンチマークで最先端のパフォーマンスを達成したことで、その効果が示唆された。
論文 参考訳(メタデータ) (2023-10-12T17:59:57Z) - Three Recipes for Better 3D Pseudo-GTs of 3D Human Mesh Estimation in
the Wild [38.063208456276335]
3次元擬似GTは3次元メッシュ推定ネットワークのトレーニングに広く利用されている。
ITWデータセットの3次元擬似GTを得るための3つのレシピを提供する。
それぞれのレシピは、深さのあいまいさ、弱監督の準最適性、そして不明瞭な明瞭さという、それぞれの側面の課題に対処します。
論文 参考訳(メタデータ) (2023-04-10T21:43:02Z) - Tracking People with 3D Representations [78.97070307547283]
ビデオ中の複数の人物を追跡する新しい手法を提案する。
従来の2次元表現を用いたアプローチとは違って,3次元空間における人物の3次元表現を用いる。
これらの環境下での3次元表現は2次元表現よりも効果的であることがわかった。
論文 参考訳(メタデータ) (2021-11-15T16:15:21Z) - 3D-OOCS: Learning Prostate Segmentation with Inductive Bias [5.907824204733372]
我々は,脊椎動物の視覚処理に触発された新しいアーキテクチャであるOOCS-enhanced Networkを紹介した。
ベースとして異なる3D U-Netの変種を伴って、第2エンコーダブロックに2つの3D残留成分(オン・オフ・センター・サラウンド)を付加する。
OOCSは、3DのU-Netが3D画像に存在する解剖学的構造を精査し、精査するのに役立つ。
論文 参考訳(メタデータ) (2021-10-29T10:14:56Z) - Deep Hybrid Self-Prior for Full 3D Mesh Generation [57.78562932397173]
本稿では,深部ニューラルネットワークにおける2D-3Dのハイブリッドな自己優先性を利用して,幾何学的品質を著しく向上する手法を提案する。
特に,まず3次元自己優先型3次元畳み込みニューラルネットワークを用いて初期メッシュを生成し,次いで2次元紫外線アトラスに3次元情報と色情報をエンコードする。
本手法は,スパース入力から高品質な3次元テクスチャメッシュモデルを復元し,テクスチャ品質とテクスチャ品質の両面で最先端の手法より優れている。
論文 参考訳(メタデータ) (2021-08-18T07:44:21Z) - 3D-to-2D Distillation for Indoor Scene Parsing [78.36781565047656]
大規模3次元データリポジトリから抽出した3次元特徴を有効活用し,RGB画像から抽出した2次元特徴を向上する手法を提案する。
まず,事前学習した3Dネットワークから3D知識を抽出して2Dネットワークを監督し,トレーニング中の2D特徴からシミュレーションされた3D特徴を学習する。
次に,2次元の正規化方式を設計し,2次元特徴と3次元特徴のキャリブレーションを行った。
第3に,非ペアの3dデータを用いたトレーニングのフレームワークを拡張するために,意味を意識した対向的トレーニングモデルを設計した。
論文 参考訳(メタデータ) (2021-04-06T02:22:24Z) - PoseNet3D: Learning Temporally Consistent 3D Human Pose via Knowledge
Distillation [6.023152721616894]
PoseNet3Dは入力として2D関節を取り、3DスケルトンとSMPLボディモデルパラメータを出力する。
まず,3Dスケルトンを出力する教師ネットワークをトレーニングし,その知識をSMPL表現で3Dスケルトンを予測する学生ネットワークに抽出する。
3次元ポーズ推定のためのHuman3.6Mデータセットの結果,従来の教師なし手法と比較して3次元関節予測誤差が18%減少することが示された。
論文 参考訳(メタデータ) (2020-03-07T00:10:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。