論文の概要: Root Pose Decomposition Towards Generic Non-rigid 3D Reconstruction with
Monocular Videos
- arxiv url: http://arxiv.org/abs/2308.10089v1
- Date: Sat, 19 Aug 2023 18:48:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-22 17:58:45.833224
- Title: Root Pose Decomposition Towards Generic Non-rigid 3D Reconstruction with
Monocular Videos
- Title(参考訳): 単眼映像による非剛性3次元再構成に向けたルートポーズ分解
- Authors: Yikai Wang, Yinpeng Dong, Fuchun Sun, Xiao Yang
- Abstract要約: 本研究は,モノクロRGB映像系列に基づく非剛体物体の3次元再構成に焦点を当てる。
我々は、オブジェクトの既知のルートポーズを仮定せず、カテゴリ固有のテンプレートや、より密なポーズ前も利用しない。
我々は,DAVIS,OVIS,AMAデータセットの最先端手法を,ルートポーズ分解(RPD)が超越していることを実験的に示す。
- 参考スコア(独自算出の注目度): 40.802486417931036
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work focuses on the 3D reconstruction of non-rigid objects based on
monocular RGB video sequences. Concretely, we aim at building high-fidelity
models for generic object categories and casually captured scenes. To this end,
we do not assume known root poses of objects, and do not utilize
category-specific templates or dense pose priors. The key idea of our method,
Root Pose Decomposition (RPD), is to maintain a per-frame root pose
transformation, meanwhile building a dense field with local transformations to
rectify the root pose. The optimization of local transformations is performed
by point registration to the canonical space. We also adapt RPD to multi-object
scenarios with object occlusions and individual differences. As a result, RPD
allows non-rigid 3D reconstruction for complicated scenarios containing objects
with large deformations, complex motion patterns, occlusions, and scale
diversities of different individuals. Such a pipeline potentially scales to
diverse sets of objects in the wild. We experimentally show that RPD surpasses
state-of-the-art methods on the challenging DAVIS, OVIS, and AMA datasets.
- Abstract(参考訳): 本研究は,モノクロRGB映像系列に基づく非剛体物体の3次元再構成に焦点を当てる。
具体的には、ジェネリックオブジェクトカテゴリとカジュアルにキャプチャされたシーンのための高忠実度モデルの構築を目指している。
この目的のために、我々はオブジェクトの既知のルートポーズを仮定せず、カテゴリ固有のテンプレートや密接なポーズプリミティブを使用しない。
本手法の重要な概念である根ポーズ分解 (rpd) は, フレームごとの根ポーズ変換を維持しつつ, 根ポーズを正す局所変換を持つ密場を構築することである。
局所変換の最適化は標準空間への点登録によって行われる。
また,オブジェクトのオクルージョンや個人差を伴うマルチオブジェクトシナリオにもrpdを適用した。
結果として、rpdは、大きな変形、複雑な動きパターン、咬合、異なる個人のスケールの多様性を持つ物体を含む複雑なシナリオに対して、非剛性3次元再構成を可能にする。
このようなパイプラインは、野生のさまざまなオブジェクトセットにスケールする可能性がある。
本研究では,DAVIS,OVIS,AMAデータセットの最先端手法をRTDが超越していることを示す。
関連論文リスト
- EasyHOI: Unleashing the Power of Large Models for Reconstructing Hand-Object Interactions in the Wild [79.71523320368388]
本研究の目的は,手動物体のインタラクションを単一視点画像から再構築することである。
まず、手ポーズとオブジェクト形状を推定する新しいパイプラインを設計する。
最初の再構築では、事前に誘導された最適化方式を採用する。
論文 参考訳(メタデータ) (2024-11-21T16:33:35Z) - Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - FrozenRecon: Pose-free 3D Scene Reconstruction with Frozen Depth Models [67.96827539201071]
本稿では,3次元シーン再構成のための新しいテスト時間最適化手法を提案する。
本手法は5つのゼロショットテストデータセット上で,最先端のクロスデータセット再構築を実現する。
論文 参考訳(メタデータ) (2023-08-10T17:55:02Z) - DTF-Net: Category-Level Pose Estimation and Shape Reconstruction via
Deformable Template Field [29.42222066097076]
RGB-Depth画像ペアから、オープンワールドシーンの6Dポーズの推定と3D形状の再構築は困難である。
本稿では,オブジェクトカテゴリの暗黙的ニューラルネットワークに基づくポーズ推定と形状再構成のための新しいフレームワークであるDTF-Netを提案する。
論文 参考訳(メタデータ) (2023-08-04T10:35:40Z) - Generative Category-Level Shape and Pose Estimation with Semantic
Primitives [27.692997522812615]
本稿では,1枚のRGB-D画像からカテゴリレベルのオブジェクト形状とポーズ推定を行う新しいフレームワークを提案する。
カテゴリ内変動に対処するために、様々な形状を統一された潜在空間にエンコードするセマンティックプリミティブ表現を採用する。
提案手法は,実世界のデータセットにおいて,SOTAのポーズ推定性能とより優れた一般化を実現する。
論文 参考訳(メタデータ) (2022-10-03T17:51:54Z) - Single-view 3D Mesh Reconstruction for Seen and Unseen Categories [69.29406107513621]
シングルビュー3Dメッシュ再構成は、シングルビューRGB画像から3D形状を復元することを目的とした、基本的なコンピュータビジョンタスクである。
本稿では,一視点3Dメッシュ再構成に取り組み,未知のカテゴリのモデル一般化について検討する。
我々は、再構築におけるカテゴリ境界を断ち切るために、エンドツーエンドの2段階ネットワークであるGenMeshを提案する。
論文 参考訳(メタデータ) (2022-08-04T14:13:35Z) - ShAPO: Implicit Representations for Multi-Object Shape, Appearance, and
Pose Optimization [40.36229450208817]
SAPO, 関節多物体検出法, 3次元テクスチャ再構築法, 6次元オブジェクトポーズ法, サイズ推定法を提案する。
ShAPOのキーはシングルショットのパイプラインで、各オブジェクトインスタンスのマスクとともに、形状、外観、遅延コードのポーズをレグレッションする。
提案手法は,NOCSデータセット上でのベースライン全体の性能を,6次元ポーズ推定におけるmAPの8%の絶対的な改善で著しく向上させる。
論文 参考訳(メタデータ) (2022-07-27T17:59:31Z) - DensePose 3D: Lifting Canonical Surface Maps of Articulated Objects to
the Third Dimension [71.71234436165255]
DensePose 3Dは2次元画像アノテーションのみから弱い教師付きで再構築を学習できる手法である。
3Dスキャンを必要としないため、DensePose 3Dは異なる動物種などの幅広いカテゴリーの学習に利用できる。
我々は,人間と動物のカテゴリーの合成データと実データの両方をベースラインとして,最先端の非剛体構造と比較し,顕著な改善を示した。
論文 参考訳(メタデータ) (2021-08-31T18:33:55Z) - Reconstructing Small 3D Objects in front of a Textured Background [0.0]
テクスチャ化された背景の前を移動する小さな物体の完全な3次元再構成手法を提案する。
これは運動から多体構造の特定のバリエーションであり、2つの物体のみに特化している。
実物を用いた実験では, 両面から3次元オブジェクトを再構成する際に, 現実的な利点があることが示されている。
論文 参考訳(メタデータ) (2021-05-24T15:36:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。