Fugu-MT 論文翻訳(概要): Learning to Detect 3D Reflection Symmetry for Single-View Reconstruction

論文の概要: Learning to Detect 3D Reflection Symmetry for Single-View Reconstruction

arxiv url: http://arxiv.org/abs/2006.10042v1
Date: Wed, 17 Jun 2020 17:58:59 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-19 20:09:59.788774
Title: Learning to Detect 3D Reflection Symmetry for Single-View Reconstruction
Title（参考訳）: 単視点再構成のための3次元反射対称性の学習
Authors: Yichao Zhou, Shichen Liu, Yi Ma
Abstract要約: 単一のRGB画像からの3D再構成は、コンピュータビジョンにおいて難しい問題である。従来の手法は通常データ駆動であり、不正確な3次元形状の復元と限定的な一般化能力をもたらす。本稿では,人造物体によく見られる反射対称性の鏡面を初めて検出し,その対称性の画素内対応を見いだして深度マップを予測する。
参考スコア（独自算出の注目度）: 32.14605731030579
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: 3D reconstruction from a single RGB image is a challenging problem in computer vision. Previous methods are usually solely data-driven, which lead to inaccurate 3D shape recovery and limited generalization capability. In this work, we focus on object-level 3D reconstruction and present a geometry-based end-to-end deep learning framework that first detects the mirror plane of reflection symmetry that commonly exists in man-made objects and then predicts depth maps by finding the intra-image pixel-wise correspondence of the symmetry. Our method fully utilizes the geometric cues from symmetry during the test time by building plane-sweep cost volumes, a powerful tool that has been used in multi-view stereopsis. To our knowledge, this is the first work that uses the concept of cost volumes in the setting of single-image 3D reconstruction. We conduct extensive experiments on the ShapeNet dataset and find that our reconstruction method significantly outperforms the previous state-of-the-art single-view 3D reconstruction networks in term of the accuracy of camera poses and depth maps, without requiring objects being completely symmetric. Code is available at https://github.com/zhou13/symmetrynet.
Abstract（参考訳）: 単一のRGB画像からの3D再構成は、コンピュータビジョンにおいて難しい問題である。従来の手法は通常データ駆動であり、不正確な3d形状復元と限定的な一般化能力をもたらす。本研究では,オブジェクトレベルの3次元再構成に着目し,まず人工物体に共通に存在する反射対称性の鏡面を検出し,その画像内画素間の対応を見出すことで深度マップを予測する,幾何学ベースのエンドツーエンドディープラーニングフレームワークを提案する。本手法は,多視点ステレオプシスで使用される強力なツールであるプレーンスウィープコストボリュームを構築することで,試験時間における対称性からの幾何学的手がかりを十分に活用する。われわれの知る限り、これは単画像3D再構成の設定におけるコストボリュームの概念を用いた最初の作品である。筆者らは,シェープネットデータセットを広範囲に実験した結果,カメラのポーズと深度マップの精度において,対象が完全に対称である必要がなく,従来の最先端のsingle-view 3dレコンストラクションネットワークを大きく上回ることを見出した。コードはhttps://github.com/zhou13/symmetrynetで入手できる。

関連論文リスト

FLARE: Feed-forward Geometry, Appearance and Camera Estimation from Uncalibrated Sparse Views [93.6881532277553]
FLAREは、高品質カメラのポーズと3次元幾何を、補正されていないスパースビュー画像から推定するために設計されたフィードフォワードモデルである。本ソリューションでは,3次元構造を2次元画像平面にマッピングする上で,カメラポーズが重要なブリッジとして機能するケースケード学習パラダイムを特徴とする。
論文参考訳（メタデータ） (2025-02-17T18:54:05Z)
DualPM: Dual Posed-Canonical Point Maps for 3D Shape and Pose Reconstruction [67.13370009386635]
そこで,Dual Point Map (DualPM)を導入し,同じ画像一点関連画素からオブジェクト上の3D位置へ,残りのポーズでオブジェクトの標準バージョンへ,一対の点マップを抽出する。 3次元再構成と3次元ポーズ推定はDualPMの予測に還元できることを示す。
論文参考訳（メタデータ） (2024-12-05T18:59:48Z)
Symmetry Strikes Back: From Single-Image Symmetry Detection to 3D Generation [29.732780338284353]
我々は,多種多様な実世界のシナリオに対して堅牢な一般化が可能なスケーラブルなゼロショット対称性検出器であるReflect3Dを紹介する。検出された対称性を単一画像の3D生成パイプラインに組み込むことの実用的利点を示す。
論文参考訳（メタデータ） (2024-11-26T04:14:31Z)
FrozenRecon: Pose-free 3D Scene Reconstruction with Frozen Depth Models [67.96827539201071]
本稿では,3次元シーン再構成のための新しいテスト時間最適化手法を提案する。本手法は5つのゼロショットテストデータセット上で,最先端のクロスデータセット再構築を実現する。
論文参考訳（メタデータ） (2023-08-10T17:55:02Z)
LIST: Learning Implicitly from Spatial Transformers for Single-View 3D Reconstruction [5.107705550575662]
Listは、局所的およびグローバルな画像特徴を活用して、単一の画像から3Dオブジェクトの幾何学的および位相的構造を再構築する、新しいニューラルネットワークである。合成画像と実世界の画像から3Dオブジェクトを再構成する際のモデルの有用性を示す。
論文参考訳（メタデータ） (2023-07-23T01:01:27Z)
3D Surface Reconstruction in the Wild by Deforming Shape Priors from Synthetic Data [24.97027425606138]
1枚の画像から被写体の3次元表面を再構築することは難しい問題である。本稿では,1枚の画像から3次元合成とオブジェクトポーズ推定を行う新しい手法を提案する。提案手法は,複数の実世界のデータセットにまたがって,最先端の再構築性能を実現する。
論文参考訳（メタデータ） (2023-02-24T20:37:27Z)
Single-view 3D Mesh Reconstruction for Seen and Unseen Categories [69.29406107513621]
シングルビュー3Dメッシュ再構成は、シングルビューRGB画像から3D形状を復元することを目的とした、基本的なコンピュータビジョンタスクである。本稿では,一視点3Dメッシュ再構成に取り組み,未知のカテゴリのモデル一般化について検討する。我々は、再構築におけるカテゴリ境界を断ち切るために、エンドツーエンドの2段階ネットワークであるGenMeshを提案する。
論文参考訳（メタデータ） (2022-08-04T14:13:35Z)
SNeS: Learning Probably Symmetric Neural Surfaces from Incomplete Data [77.53134858717728]
我々はニューラルレイディアンスフィールド(NeRF)のようなニューラルリコンストラクションとレンダリングの最近の進歩の強みの上に構築する。我々は3次元形状と材料特性にソフト対称性の制約を適用し,光,アルベド色,反射率に分解された外観を有する。保存されていない領域を高い忠実度で再構成し、高品質な新しいビュー画像を作成することができることを示す。
論文参考訳（メタデータ） (2022-06-13T17:37:50Z)
Beyond 3DMM: Learning to Capture High-fidelity 3D Face Shape [77.95154911528365]
3Dモーフィブルモデル(3DMM)の適合性は、その強力な3D先行性のため、顔解析に広く有用である。以前に再建された3次元顔は、微細な形状が失われるため、視差の低下に悩まされていた。本論文は, パーソナライズされた形状が対応する人物と同一に見えるよう, パーソナライズされた形状を捉えるための完全な解を提案する。
論文参考訳（メタデータ） (2022-04-09T03:46:18Z)
Toward Realistic Single-View 3D Object Reconstruction with Unsupervised Learning from Multiple Images [18.888384816156744]
マルチイメージデータセットから3次元再構成ネットワークを学習するための新しい教師なしアルゴリズムを提案する。我々のアルゴリズムはより一般的であり、特別の場合として対称性が要求されるシナリオをカバーしている。我々の手法は、品質と堅牢性の両方において、これまでの仕事を上回っている。
論文参考訳（メタデータ） (2021-09-06T08:34:04Z)
Hybrid Approach for 3D Head Reconstruction: Using Neural Networks and Visual Geometry [3.970492757288025]
本稿では,深層学習と幾何学的手法に基づくハイブリッド手法を用いて,複数の画像から3次元頭部を再構築する手法を提案する。 U-netアーキテクチャに基づくエンコーダデコーダネットワークを提案し、合成データのみを学習する。
論文参考訳（メタデータ） (2021-04-28T11:31:35Z)
NeRD: Neural 3D Reflection Symmetry Detector [27.626579746101292]
ニューラル3次元反射対称性検出器NeRDについて述べる。まず、粗大な戦略で対称性平面を列挙し、それから3次元のコストボリュームを構築することで最良の平面を見つける。実験の結果,本手法で検出した対称性平面は直接CNN回帰から検出した平面よりもかなり精度が高いことがわかった。
論文参考訳（メタデータ） (2021-04-19T17:25:51Z)
From Points to Multi-Object 3D Reconstruction [71.17445805257196]
単一のRGB画像から複数の3Dオブジェクトを検出し再構成する方法を提案する。キーポイント検出器は、オブジェクトを中心点としてローカライズし、9-DoF境界ボックスや3D形状を含む全てのオブジェクト特性を直接予測する。提示されたアプローチは、軽量な再構築を単一ステージで実行し、リアルタイム能力を持ち、完全に微分可能で、エンドツーエンドのトレーナーブルである。
論文参考訳（メタデータ） (2020-12-21T18:52:21Z)
Deep 3D Capture: Geometry and Reflectance from Sparse Multi-View Images [59.906948203578544]
本稿では,任意の物体の高品質な形状と複雑な空間変化を持つBRDFを再構成する学習に基づく新しい手法を提案する。まず、深層多視点ステレオネットワークを用いて、ビューごとの深度マップを推定する。これらの深度マップは、異なるビューを粗く整列するために使用される。本稿では,新しい多視点反射率推定ネットワークアーキテクチャを提案する。
論文参考訳（メタデータ） (2020-03-27T21:28:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。