論文の概要: Discovering 3D Parts from Image Collections
- arxiv url: http://arxiv.org/abs/2107.13629v1
- Date: Wed, 28 Jul 2021 20:29:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-31 00:04:46.057933
- Title: Discovering 3D Parts from Image Collections
- Title(参考訳): 画像から3d部品を発見
- Authors: Chun-Han Yao, Wei-Chih Hung, Varun Jampani, Ming-Hsuan Yang
- Abstract要約: 本稿では,2次元画像収集のみによる3次元部分発見の問題に対処する。
そこで我々は,手動で注釈付部品を監督する代わりに,自己監督型アプローチを提案する。
私たちのキーとなる洞察は、前もって新しい部分の形状を学習することで、各部分は、単純な幾何学を持つように制約されたまま、忠実にオブジェクトの形状に適合できるようにします。
- 参考スコア(独自算出の注目度): 98.16987919686709
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reasoning 3D shapes from 2D images is an essential yet challenging task,
especially when only single-view images are at our disposal. While an object
can have a complicated shape, individual parts are usually close to geometric
primitives and thus are easier to model. Furthermore, parts provide a mid-level
representation that is robust to appearance variations across objects in a
particular category. In this work, we tackle the problem of 3D part discovery
from only 2D image collections. Instead of relying on manually annotated parts
for supervision, we propose a self-supervised approach, latent part discovery
(LPD). Our key insight is to learn a novel part shape prior that allows each
part to fit an object shape faithfully while constrained to have simple
geometry. Extensive experiments on the synthetic ShapeNet, PartNet, and
real-world Pascal 3D+ datasets show that our method discovers consistent object
parts and achieves favorable reconstruction accuracy compared to the existing
methods with the same level of supervision.
- Abstract(参考訳): 2次元画像から3次元形状を推論することは、特に1枚の画像しか処理できない場合、不可欠だが困難な作業である。
オブジェクトは複雑な形状を持つことができるが、個々のパーツは通常幾何学的プリミティブに近いため、モデル化が容易である。
さらに、部品は特定のカテゴリのオブジェクト間の外観の変化に対して堅牢な中間レベル表現を提供する。
本研究では,2次元画像収集のみによる3次元部分発見の問題に取り組む。
そこで我々は,手動で注釈付き部品を監督する代わりに,自己監督的アプローチ,潜伏部分発見(LPD)を提案する。
私たちの重要な洞察は、単純な幾何学を持つように制約されながら、各部分が忠実に対象の形状に適合することを可能にする、新しい部分形状を事前に学ぶことです。
合成ShapeNet,PartNet,および実世界のPascal 3D+データセットの大規模な実験により,本手法が一貫した対象部分を発見し,同じレベルの監督レベルを持つ既存手法と比較して良好な再構成精度が得られることが示された。
関連論文リスト
- Part123: Part-aware 3D Reconstruction from a Single-view Image [54.589723979757515]
Part123は、一視点画像から部分認識された3D再構成のための新しいフレームワークである。
ニューラルレンダリングフレームワークにコントラスト学習を導入し、部分認識機能空間を学習する。
クラスタリングに基づくアルゴリズムも開発され、再構成されたモデルから3次元部分分割結果を自動的に導出する。
論文 参考訳(メタデータ) (2024-05-27T07:10:21Z) - Single-view 3D Scene Reconstruction with High-fidelity Shape and Texture [47.44029968307207]
本研究では,物体の形状とテクスチャを同時に高忠実度に再現する新しい枠組みを提案する。
提案手法は,SSR(Single-view Neural implicit Shape and Radiance Field)表現を用いて,明示的な3次元形状制御とボリュームレンダリングの両方を活用する。
我々のフレームワークの特徴は、単一のビュー3D再構成モデルにレンダリング機能をシームレスに統合しながら、きめ細かいテクスチャメッシュを生成する能力である。
論文 参考訳(メタデータ) (2023-11-01T11:46:15Z) - 3D Surface Reconstruction in the Wild by Deforming Shape Priors from
Synthetic Data [24.97027425606138]
1枚の画像から被写体の3次元表面を再構築することは難しい問題である。
本稿では,1枚の画像から3次元合成とオブジェクトポーズ推定を行う新しい手法を提案する。
提案手法は,複数の実世界のデータセットにまたがって,最先端の再構築性能を実現する。
論文 参考訳(メタデータ) (2023-02-24T20:37:27Z) - Single-view 3D Mesh Reconstruction for Seen and Unseen Categories [69.29406107513621]
シングルビュー3Dメッシュ再構成は、シングルビューRGB画像から3D形状を復元することを目的とした、基本的なコンピュータビジョンタスクである。
本稿では,一視点3Dメッシュ再構成に取り組み,未知のカテゴリのモデル一般化について検討する。
我々は、再構築におけるカテゴリ境界を断ち切るために、エンドツーエンドの2段階ネットワークであるGenMeshを提案する。
論文 参考訳(メタデータ) (2022-08-04T14:13:35Z) - AutoSweep: Recovering 3D Editable Objectsfrom a Single Photograph [54.701098964773756]
セマンティックな部分で3Dオブジェクトを復元し、直接編集することを目的としている。
我々の研究は、一般化された立方体と一般化されたシリンダーという、2種類の原始的な形状の物体を回収する試みである。
提案アルゴリズムは,高品質な3Dモデルを復元し,既存手法のインスタンスセグメンテーションと3D再構成の両方で性能を向上する。
論文 参考訳(メタデータ) (2020-05-27T12:16:24Z) - CoReNet: Coherent 3D scene reconstruction from a single RGB image [43.74240268086773]
我々は1つのRBG画像のみを入力として与えられた1つの物体の形状を再構築する深層学習の進歩の上に構築する。
提案する3つの拡張は,(1)局所的な2次元情報を物理的に正しい方法で出力3Dボリュームに伝播するレイトレーシングスキップ接続,(2)翻訳同変モデルの構築を可能にするハイブリッド3Dボリューム表現,(3)全体オブジェクトの形状を捉えるために調整された再構成損失である。
すべての物体がカメラに対して一貫した1つの3次元座標フレームに居住し、3次元空間内では交差しないコヒーレントな再構成を実現する。
論文 参考訳(メタデータ) (2020-04-27T17:53:07Z) - Learning Unsupervised Hierarchical Part Decomposition of 3D Objects from
a Single RGB Image [102.44347847154867]
プリミティブの集合として3次元オブジェクトの幾何を共同で復元できる新しい定式化を提案する。
我々のモデルは、プリミティブのバイナリツリーの形で、様々なオブジェクトの高レベルな構造的分解を復元する。
ShapeNet と D-FAUST のデータセットを用いた実験により,部品の組織化を考慮すれば3次元形状の推論が容易になることが示された。
論文 参考訳(メタデータ) (2020-04-02T17:58:05Z) - Self-supervised Single-view 3D Reconstruction via Semantic Consistency [142.71430568330172]
対象物の形状, テクスチャ, カメラポーズを予測できる, 自己監督型, 単視点3D再構成モデルを学習する。
提案手法では,手動で注釈付けしたキーポイント,オブジェクトのマルチビューイメージ,あるいは事前の3Dテンプレートなど,3Dの監督を必要としない。
論文 参考訳(メタデータ) (2020-03-13T20:29:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。