論文の概要: Learning to Detect 3D Reflection Symmetry for Single-View Reconstruction
- arxiv url: http://arxiv.org/abs/2006.10042v1
- Date: Wed, 17 Jun 2020 17:58:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-19 20:09:59.788774
- Title: Learning to Detect 3D Reflection Symmetry for Single-View Reconstruction
- Title(参考訳): 単視点再構成のための3次元反射対称性の学習
- Authors: Yichao Zhou, Shichen Liu, Yi Ma
- Abstract要約: 単一のRGB画像からの3D再構成は、コンピュータビジョンにおいて難しい問題である。
従来の手法は通常データ駆動であり、不正確な3次元形状の復元と限定的な一般化能力をもたらす。
本稿では,人造物体によく見られる反射対称性の鏡面を初めて検出し,その対称性の画素内対応を見いだして深度マップを予測する。
- 参考スコア(独自算出の注目度): 32.14605731030579
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D reconstruction from a single RGB image is a challenging problem in
computer vision. Previous methods are usually solely data-driven, which lead to
inaccurate 3D shape recovery and limited generalization capability. In this
work, we focus on object-level 3D reconstruction and present a geometry-based
end-to-end deep learning framework that first detects the mirror plane of
reflection symmetry that commonly exists in man-made objects and then predicts
depth maps by finding the intra-image pixel-wise correspondence of the
symmetry. Our method fully utilizes the geometric cues from symmetry during the
test time by building plane-sweep cost volumes, a powerful tool that has been
used in multi-view stereopsis. To our knowledge, this is the first work that
uses the concept of cost volumes in the setting of single-image 3D
reconstruction. We conduct extensive experiments on the ShapeNet dataset and
find that our reconstruction method significantly outperforms the previous
state-of-the-art single-view 3D reconstruction networks in term of the accuracy
of camera poses and depth maps, without requiring objects being completely
symmetric. Code is available at https://github.com/zhou13/symmetrynet.
- Abstract(参考訳): 単一のRGB画像からの3D再構成は、コンピュータビジョンにおいて難しい問題である。
従来の手法は通常データ駆動であり、不正確な3d形状復元と限定的な一般化能力をもたらす。
本研究では,オブジェクトレベルの3次元再構成に着目し,まず人工物体に共通に存在する反射対称性の鏡面を検出し,その画像内画素間の対応を見出すことで深度マップを予測する,幾何学ベースのエンドツーエンドディープラーニングフレームワークを提案する。
本手法は,多視点ステレオプシスで使用される強力なツールであるプレーンスウィープコストボリュームを構築することで,試験時間における対称性からの幾何学的手がかりを十分に活用する。
われわれの知る限り、これは単画像3D再構成の設定におけるコストボリュームの概念を用いた最初の作品である。
筆者らは,シェープネットデータセットを広範囲に実験した結果,カメラのポーズと深度マップの精度において,対象が完全に対称である必要がなく,従来の最先端のsingle-view 3dレコンストラクションネットワークを大きく上回ることを見出した。
コードはhttps://github.com/zhou13/symmetrynetで入手できる。
関連論文リスト
- FLARE: Feed-forward Geometry, Appearance and Camera Estimation from Uncalibrated Sparse Views [93.6881532277553]
FLAREは、高品質カメラのポーズと3次元幾何を、補正されていないスパースビュー画像から推定するために設計されたフィードフォワードモデルである。
本ソリューションでは,3次元構造を2次元画像平面にマッピングする上で,カメラポーズが重要なブリッジとして機能するケースケード学習パラダイムを特徴とする。
論文 参考訳(メタデータ) (2025-02-17T18:54:05Z) - DualPM: Dual Posed-Canonical Point Maps for 3D Shape and Pose Reconstruction [67.13370009386635]
そこで,Dual Point Maps (DualPM) では,同じ画像から一対の点マップを抽出し,一対の点マップをオブジェクト上の3D位置と関連付け,一対の点マップを静止時の標準バージョンに関連付ける。
3次元再構成と3次元ポーズ推定がDualPMの予測に比例することを示した。
論文 参考訳(メタデータ) (2024-12-05T18:59:48Z) - Symmetry Strikes Back: From Single-Image Symmetry Detection to 3D Generation [29.732780338284353]
我々は,多種多様な実世界のシナリオに対して堅牢な一般化が可能なスケーラブルなゼロショット対称性検出器であるReflect3Dを紹介する。
検出された対称性を単一画像の3D生成パイプラインに組み込むことの実用的利点を示す。
論文 参考訳(メタデータ) (2024-11-26T04:14:31Z) - 3D Surface Reconstruction in the Wild by Deforming Shape Priors from
Synthetic Data [24.97027425606138]
1枚の画像から被写体の3次元表面を再構築することは難しい問題である。
本稿では,1枚の画像から3次元合成とオブジェクトポーズ推定を行う新しい手法を提案する。
提案手法は,複数の実世界のデータセットにまたがって,最先端の再構築性能を実現する。
論文 参考訳(メタデータ) (2023-02-24T20:37:27Z) - Single-view 3D Mesh Reconstruction for Seen and Unseen Categories [69.29406107513621]
シングルビュー3Dメッシュ再構成は、シングルビューRGB画像から3D形状を復元することを目的とした、基本的なコンピュータビジョンタスクである。
本稿では,一視点3Dメッシュ再構成に取り組み,未知のカテゴリのモデル一般化について検討する。
我々は、再構築におけるカテゴリ境界を断ち切るために、エンドツーエンドの2段階ネットワークであるGenMeshを提案する。
論文 参考訳(メタデータ) (2022-08-04T14:13:35Z) - Beyond 3DMM: Learning to Capture High-fidelity 3D Face Shape [77.95154911528365]
3Dモーフィブルモデル(3DMM)の適合性は、その強力な3D先行性のため、顔解析に広く有用である。
以前に再建された3次元顔は、微細な形状が失われるため、視差の低下に悩まされていた。
本論文は, パーソナライズされた形状が対応する人物と同一に見えるよう, パーソナライズされた形状を捉えるための完全な解を提案する。
論文 参考訳(メタデータ) (2022-04-09T03:46:18Z) - Toward Realistic Single-View 3D Object Reconstruction with Unsupervised
Learning from Multiple Images [18.888384816156744]
マルチイメージデータセットから3次元再構成ネットワークを学習するための新しい教師なしアルゴリズムを提案する。
我々のアルゴリズムはより一般的であり、特別の場合として対称性が要求されるシナリオをカバーしている。
我々の手法は、品質と堅牢性の両方において、これまでの仕事を上回っている。
論文 参考訳(メタデータ) (2021-09-06T08:34:04Z) - Hybrid Approach for 3D Head Reconstruction: Using Neural Networks and
Visual Geometry [3.970492757288025]
本稿では,深層学習と幾何学的手法に基づくハイブリッド手法を用いて,複数の画像から3次元頭部を再構築する手法を提案する。
U-netアーキテクチャに基づくエンコーダデコーダネットワークを提案し、合成データのみを学習する。
論文 参考訳(メタデータ) (2021-04-28T11:31:35Z) - NeRD: Neural 3D Reflection Symmetry Detector [27.626579746101292]
ニューラル3次元反射対称性検出器NeRDについて述べる。
まず、粗大な戦略で対称性平面を列挙し、それから3次元のコストボリュームを構築することで最良の平面を見つける。
実験の結果,本手法で検出した対称性平面は直接CNN回帰から検出した平面よりもかなり精度が高いことがわかった。
論文 参考訳(メタデータ) (2021-04-19T17:25:51Z) - From Points to Multi-Object 3D Reconstruction [71.17445805257196]
単一のRGB画像から複数の3Dオブジェクトを検出し再構成する方法を提案する。
キーポイント検出器は、オブジェクトを中心点としてローカライズし、9-DoF境界ボックスや3D形状を含む全てのオブジェクト特性を直接予測する。
提示されたアプローチは、軽量な再構築を単一ステージで実行し、リアルタイム能力を持ち、完全に微分可能で、エンドツーエンドのトレーナーブルである。
論文 参考訳(メタデータ) (2020-12-21T18:52:21Z) - Deep 3D Capture: Geometry and Reflectance from Sparse Multi-View Images [59.906948203578544]
本稿では,任意の物体の高品質な形状と複雑な空間変化を持つBRDFを再構成する学習に基づく新しい手法を提案する。
まず、深層多視点ステレオネットワークを用いて、ビューごとの深度マップを推定する。
これらの深度マップは、異なるビューを粗く整列するために使用される。
本稿では,新しい多視点反射率推定ネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-03-27T21:28:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。