論文の概要: Structure from Duplicates: Neural Inverse Graphics from a Pile of
Objects
- arxiv url: http://arxiv.org/abs/2401.05236v1
- Date: Wed, 10 Jan 2024 16:07:40 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-11 14:20:40.155324
- Title: Structure from Duplicates: Neural Inverse Graphics from a Pile of
Objects
- Title(参考訳): 重複物の構造:物体の杭からのニューラル逆グラフ
- Authors: Tianhang Cheng, Wei-Chiu Ma, Kaiyu Guan, and Antonio Torralba,
Shenlong Wang
- Abstract要約: 本稿では,新しい逆グラフィックスフレームワークであるStructure from Duplicatesを紹介する。
複数の同一物体を含む単一の画像から幾何学、材料、照明を再構成する。
SfDは、単一の画像から複数ビューキューを活用することで、より現実的で詳細な3D再構成を生成する。
- 参考スコア(独自算出の注目度): 47.14442155536931
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Our world is full of identical objects (\emphe.g., cans of coke, cars of same
model). These duplicates, when seen together, provide additional and strong
cues for us to effectively reason about 3D. Inspired by this observation, we
introduce Structure from Duplicates (SfD), a novel inverse graphics framework
that reconstructs geometry, material, and illumination from a single image
containing multiple identical objects. SfD begins by identifying multiple
instances of an object within an image, and then jointly estimates the 6DoF
pose for all instances.An inverse graphics pipeline is subsequently employed to
jointly reason about the shape, material of the object, and the environment
light, while adhering to the shared geometry and material constraint across
instances. Our primary contributions involve utilizing object duplicates as a
robust prior for single-image inverse graphics and proposing an in-plane
rotation-robust Structure from Motion (SfM) formulation for joint 6-DoF object
pose estimation. By leveraging multi-view cues from a single image, SfD
generates more realistic and detailed 3D reconstructions, significantly
outperforming existing single image reconstruction models and multi-view
reconstruction approaches with a similar or greater number of observations.
- Abstract(参考訳): 私たちの世界は同一の物体(例)でいっぱいです。
コークスの缶、同じモデルの車)。
これらの複製は、一緒に見られると、3dを効果的に推論するための追加的かつ強力な手がかりとなります。
この観察に触発されて、複数の同一のオブジェクトを含む単一の画像から幾何学、材料、照明を再構成する新しい逆グラフィックスフレームワークであるstructure from duplicates (sfd)を紹介する。
SfDは、画像内のオブジェクトの複数のインスタンスを特定し、次に、すべてのインスタンスに対する6DoFのポーズを共同で推定することから始まり、その後、オブジェクトの形状、材料、環境光について共同で推論するために、インスタンス間の共有幾何学と材料制約に固執しながら、逆グラフパイプラインが使用される。
我々の主な貢献は、単像逆画像の頑健な先行としてオブジェクト複製を利用することと、関節6-DoFオブジェクトポーズ推定のための平面内回転ロバスト構造(SfM)の提案である。
単一の画像からのマルチビューのヒントを利用することで、sfdはよりリアルで詳細な3d再構成を生成し、既存の1つの画像再構成モデルや、類似またはより多くの観察によるマルチビュー再構成アプローチを大きく上回る。
関連論文リスト
- EasyHOI: Unleashing the Power of Large Models for Reconstructing Hand-Object Interactions in the Wild [79.71523320368388]
本研究の目的は,手動物体のインタラクションを単一視点画像から再構築することである。
まず、手ポーズとオブジェクト形状を推定する新しいパイプラインを設計する。
最初の再構築では、事前に誘導された最適化方式を採用する。
論文 参考訳(メタデータ) (2024-11-21T16:33:35Z) - Part123: Part-aware 3D Reconstruction from a Single-view Image [54.589723979757515]
Part123は、一視点画像から部分認識された3D再構成のための新しいフレームワークである。
ニューラルレンダリングフレームワークにコントラスト学習を導入し、部分認識機能空間を学習する。
クラスタリングに基づくアルゴリズムも開発され、再構成されたモデルから3次元部分分割結果を自動的に導出する。
論文 参考訳(メタデータ) (2024-05-27T07:10:21Z) - LIST: Learning Implicitly from Spatial Transformers for Single-View 3D
Reconstruction [5.107705550575662]
Listは、局所的およびグローバルな画像特徴を活用して、単一の画像から3Dオブジェクトの幾何学的および位相的構造を再構築する、新しいニューラルネットワークである。
合成画像と実世界の画像から3Dオブジェクトを再構成する際のモデルの有用性を示す。
論文 参考訳(メタデータ) (2023-07-23T01:01:27Z) - A Divide et Impera Approach for 3D Shape Reconstruction from Multiple
Views [49.03830902235915]
物体の3次元形状を1つまたは複数の画像から推定することは、最近のディープラーニングによるブレークスルーによって人気を集めている。
本稿では,与えられた視点からの可視情報を統合することで,視点変化の再構築に頼ることを提案する。
提案手法を検証するために,相対的なポーズ推定と3次元形状再構成の観点から,ShapeNet参照ベンチマークの総合評価を行った。
論文 参考訳(メタデータ) (2020-11-17T09:59:32Z) - Learning Unsupervised Hierarchical Part Decomposition of 3D Objects from
a Single RGB Image [102.44347847154867]
プリミティブの集合として3次元オブジェクトの幾何を共同で復元できる新しい定式化を提案する。
我々のモデルは、プリミティブのバイナリツリーの形で、様々なオブジェクトの高レベルな構造的分解を復元する。
ShapeNet と D-FAUST のデータセットを用いた実験により,部品の組織化を考慮すれば3次元形状の推論が容易になることが示された。
論文 参考訳(メタデータ) (2020-04-02T17:58:05Z) - Self-supervised Single-view 3D Reconstruction via Semantic Consistency [142.71430568330172]
対象物の形状, テクスチャ, カメラポーズを予測できる, 自己監督型, 単視点3D再構成モデルを学習する。
提案手法では,手動で注釈付けしたキーポイント,オブジェクトのマルチビューイメージ,あるいは事前の3Dテンプレートなど,3Dの監督を必要としない。
論文 参考訳(メタデータ) (2020-03-13T20:29:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。