論文の概要: Learning Implicit Representation for Reconstructing Articulated Objects
- arxiv url: http://arxiv.org/abs/2401.08809v1
- Date: Tue, 16 Jan 2024 20:22:37 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-18 17:46:38.503249
- Title: Learning Implicit Representation for Reconstructing Articulated Objects
- Title(参考訳): 人工物再構成のための暗黙表現の学習
- Authors: Hao Zhang, Fang Li, Samyak Rawlekar, and Narendra Ahuja
- Abstract要約: 物理制約を正規化用語として用いるアルゴリズムを導入し,暗黙的表現と明示的表現の両方を反復的に推定する。
そこで本手法は,カテゴリ別スケルトンの必要性を排除し,標準ビデオデータセットにおける最先端の手法であることを示す。
- 参考スコア(独自算出の注目度): 13.510513575340106
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D Reconstruction of moving articulated objects without additional
information about object structure is a challenging problem. Current methods
overcome such challenges by employing category-specific skeletal models.
Consequently, they do not generalize well to articulated objects in the wild.
We treat an articulated object as an unknown, semi-rigid skeletal structure
surrounded by nonrigid material (e.g., skin). Our method simultaneously
estimates the visible (explicit) representation (3D shapes, colors, camera
parameters) and the implicit skeletal representation, from motion cues in the
object video without 3D supervision. Our implicit representation consists of
four parts. (1) Skeleton, which specifies how semi-rigid parts are connected.
(2) \textcolor{black}{Skinning Weights}, which associates each surface vertex
with semi-rigid parts with probability. (3) Rigidity Coefficients, specifying
the articulation of the local surface. (4) Time-Varying Transformations, which
specify the skeletal motion and surface deformation parameters. We introduce an
algorithm that uses physical constraints as regularization terms and
iteratively estimates both implicit and explicit representations. Our method is
category-agnostic, thus eliminating the need for category-specific skeletons,
we show that our method outperforms state-of-the-art across standard video
datasets.
- Abstract(参考訳): 物体構造に関する追加情報のない移動物体の3次元再構成は難しい問題である。
現在の手法では、カテゴリ固有の骨格モデルを用いることでそのような課題を克服している。
したがって、彼らは野生の明瞭な対象に対してうまく一般化しない。
非剛性物質(例えば皮膚)に囲まれた未知の半剛性骨格構造として関節性物体を扱います。
提案手法は,3次元映像の視覚的(明示的な)表現(3次元形状,色,カメラパラメータ)と暗黙的な骨格表現を3次元の監督なしに同時に推定する。
暗黙の表現は4つの部分からなる。
1)半剛性部分の連結の仕方を規定する骨格。
(2) \textcolor{black}{skinning weights} は、各曲面頂点と半剛性部分と確率を関連付ける。
(3)局所表面の明瞭度を指定する剛性係数。
(4) 骨格運動と表面変形パラメータを規定する時間変化変換。
物理制約を正規化用語として用いるアルゴリズムを導入し,暗黙的表現と明示的表現の両方を反復的に推定する。
そこで本手法は,カテゴリ別スケルトンの必要性を排除し,標準ビデオデータセットにおける最先端の手法であることを示す。
関連論文リスト
- REACTO: Reconstructing Articulated Objects from a Single Video [64.89760223391573]
関節の柔軟な変形を維持しつつ各部の剛性を向上する新しい変形モデルを提案する。
提案手法は, 従来よりも高忠実度な3D再構成を実現する上で, 従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2024-04-17T08:01:55Z) - Neural Implicit Representation for Building Digital Twins of Unknown Articulated Objects [42.32306418464438]
本稿では2つのRGBDスキャンから未知の調音物体のディジタル双対を異なる調音状態で構築する問題に対処する。
提案手法は,まず各状態におけるオブジェクトレベルの形状を再構成し,基礎となる調音モデルを復元する。
また、複数の可動部も扱っており、以前の物体の形や構造に依存していない。
論文 参考訳(メタデータ) (2024-04-01T19:23:00Z) - CAMM: Building Category-Agnostic and Animatable 3D Models from Monocular
Videos [3.356334042188362]
そこで本研究では,任意の対象に対してアニマタブルなキネマティックチェインを学習する手法を提案する。
本手法は,多種多様な対象カテゴリーにおける最先端の3次元表面再構成法と同等である。
論文 参考訳(メタデータ) (2023-04-14T06:07:54Z) - BundleSDF: Neural 6-DoF Tracking and 3D Reconstruction of Unknown
Objects [89.2314092102403]
モノクロRGBDビデオシーケンスから未知物体の6-DoF追跡をリアルタイムに行う手法を提案する。
視覚的テクスチャがほとんど欠如している場合でも,任意の剛体オブジェクトに対して有効である。
論文 参考訳(メタデータ) (2023-03-24T17:13:49Z) - Unsupervised Kinematic Motion Detection for Part-segmented 3D Shape
Collections [14.899075941080541]
本研究では,部分分割型3次元形状収集における調音運動の発見のための教師なしアプローチを提案する。
私たちのアプローチは、カテゴリクロージャと呼ばれる概念に基づいています。オブジェクトの部分の有効な記述は、オブジェクトを同じ意味圏に保つべきです。
我々は、PartNet-Mobilityデータセットから部品の動きを再発見するためにこれを用いてアプローチを評価した。
論文 参考訳(メタデータ) (2022-06-17T00:50:36Z) - Watch It Move: Unsupervised Discovery of 3D Joints for Re-Posing of
Articulated Objects [73.23249640099516]
複数視点からの移動を観察することで,これまで見えなかった物体の外観と構造の両方を学習する。
我々の洞察では、互いに相対的に動く隣り合う部分は関節で繋がらなければならない。
本手法は,四足歩行から単腕ロボット,人間に至るまで,さまざまな構造に対して有効であることを示す。
論文 参考訳(メタデータ) (2021-12-21T16:37:48Z) - DensePose 3D: Lifting Canonical Surface Maps of Articulated Objects to
the Third Dimension [71.71234436165255]
DensePose 3Dは2次元画像アノテーションのみから弱い教師付きで再構築を学習できる手法である。
3Dスキャンを必要としないため、DensePose 3Dは異なる動物種などの幅広いカテゴリーの学習に利用できる。
我々は,人間と動物のカテゴリーの合成データと実データの両方をベースラインとして,最先端の非剛体構造と比較し,顕著な改善を示した。
論文 参考訳(メタデータ) (2021-08-31T18:33:55Z) - Canonical 3D Deformer Maps: Unifying parametric and non-parametric
methods for dense weakly-supervised category reconstruction [79.98689027127855]
独立オブジェクトの2次元画像の集合から学習できる共通オブジェクトカテゴリの3次元形状の表現を提案する。
提案手法は, パラメトリック変形モデル, 非パラメトリック3次元再構成, 標準埋め込みの概念に基づく新しい手法で構築する。
顔、車、鳥の野生のデータセットを3Dで再現することで、最先端の成果が得られます。
論文 参考訳(メタデータ) (2020-08-28T15:44:05Z) - SkeletonNet: A Topology-Preserving Solution for Learning Mesh
Reconstruction of Object Surfaces from RGB Images [85.66560542483286]
本稿では,RGB画像から3次元物体表面再構成を学習する上での課題に焦点を当てる。
我々は,SkeGCNNとSkeDISNの2つのモデルを提案する。
提案するSkeletonNetの有効性を検証するための徹底的な実験を行った。
論文 参考訳(メタデータ) (2020-08-13T07:59:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。