論文の概要: Deep 3D Capture: Geometry and Reflectance from Sparse Multi-View Images
- arxiv url: http://arxiv.org/abs/2003.12642v2
- Date: Sat, 4 Jul 2020 07:48:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-19 05:30:02.779994
- Title: Deep 3D Capture: Geometry and Reflectance from Sparse Multi-View Images
- Title(参考訳): 深部3次元キャプチャ:スパースマルチビュー画像からの幾何学と反射
- Authors: Sai Bi, Zexiang Xu, Kalyan Sunkavalli, David Kriegman, Ravi
Ramamoorthi
- Abstract要約: 本稿では,任意の物体の高品質な形状と複雑な空間変化を持つBRDFを再構成する学習に基づく新しい手法を提案する。
まず、深層多視点ステレオネットワークを用いて、ビューごとの深度マップを推定する。
これらの深度マップは、異なるビューを粗く整列するために使用される。
本稿では,新しい多視点反射率推定ネットワークアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 59.906948203578544
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce a novel learning-based method to reconstruct the high-quality
geometry and complex, spatially-varying BRDF of an arbitrary object from a
sparse set of only six images captured by wide-baseline cameras under
collocated point lighting. We first estimate per-view depth maps using a deep
multi-view stereo network; these depth maps are used to coarsely align the
different views. We propose a novel multi-view reflectance estimation network
architecture that is trained to pool features from these coarsely aligned
images and predict per-view spatially-varying diffuse albedo, surface normals,
specular roughness and specular albedo. We do this by jointly optimizing the
latent space of our multi-view reflectance network to minimize the photometric
error between images rendered with our predictions and the input images. While
previous state-of-the-art methods fail on such sparse acquisition setups, we
demonstrate, via extensive experiments on synthetic and real data, that our
method produces high-quality reconstructions that can be used to render
photorealistic images.
- Abstract(参考訳): そこで本研究では,任意の物体の高画質かつ複雑なBRDFを,広視野カメラで撮影した6つの画像のスパース集合から再構成する学習手法を提案する。
まず、深層多視点ステレオネットワークを用いてビューごとの深度マップを推定し、これらの深度マップを用いて異なるビューを粗く整列する。
本稿では,これらの粗い整列画像から特徴をプールし,空間的に異なる拡散アルベド,表面正規度,スペクトル粗さ,スペクトルアルベドを推定する,新しい多視点反射率推定ネットワークアーキテクチャを提案する。
我々は,マルチビュー・リフレクタンス・ネットワークの潜時空間を協調的に最適化し,予測画像と入力画像との光度誤差を最小化する。
従来の最先端の手法は、このようなスパースな取得装置では失敗するが、合成および実データに関する広範な実験により、本手法は、フォトリアリスティック画像の描画に使用できる高品質な再構成を生成することを実証する。
関連論文リスト
- Refinement of Monocular Depth Maps via Multi-View Differentiable Rendering [4.717325308876748]
本稿では,複数の画像から一貫した詳細な深度マップを生成するための新しい手法を提案する。
我々は、位相的に完全だが計量的に不正確な深度マップを生成する単眼深度推定の進歩を活用する。
提案手法は,高密度で詳細で高品質な深度マップを作成でき,また屋内シナリオの挑戦も可能であり,最先端の深度復元手法よりも優れている。
論文 参考訳(メタデータ) (2024-10-04T18:50:28Z) - Pixel-Aligned Multi-View Generation with Depth Guided Decoder [86.1813201212539]
画素レベルの画像・マルチビュー生成のための新しい手法を提案する。
従来の作業とは異なり、潜伏映像拡散モデルのVAEデコーダにマルチビュー画像にアテンション層を組み込む。
本モデルにより,マルチビュー画像間の画素アライメントが向上する。
論文 参考訳(メタデータ) (2024-08-26T04:56:41Z) - NeRSP: Neural 3D Reconstruction for Reflective Objects with Sparse Polarized Images [62.752710734332894]
NeRSPはスパース偏光画像を用いた反射面のニューラル3次元再構成技術である。
偏光画像形成モデルと多視点方位整合性から測光的および幾何学的手がかりを導出する。
我々は6つのビューのみを入力として、最先端の表面再構成結果を達成する。
論文 参考訳(メタデータ) (2024-06-11T09:53:18Z) - Holistic Inverse Rendering of Complex Facade via Aerial 3D Scanning [38.72679977945778]
我々は多視点空中画像を用いて、ニューラルサイン距離場(SDF)を用いたファサードの形状、照明、材料を再構成する。
本実験は, ファサード全体の逆レンダリング, 新規なビュー合成, シーン編集において, 最先端のベースラインと比較して, 手法の優れた品質を示すものである。
論文 参考訳(メタデータ) (2023-11-20T15:03:56Z) - TMO: Textured Mesh Acquisition of Objects with a Mobile Device by using
Differentiable Rendering [54.35405028643051]
スマートフォン1台でテクスチャ化されたメッシュを野生で取得するパイプラインを新たに提案する。
提案手法ではまず,RGBD支援構造を動きから導入し,フィルタした深度マップを作成できる。
我々は,高品質なメッシュを実現するニューラル暗黙表面再構成法を採用する。
論文 参考訳(メタデータ) (2023-03-27T10:07:52Z) - Neural 3D Reconstruction in the Wild [86.6264706256377]
そこで我々は,インターネット写真コレクションから効率よく高精度な表面再構成を実現する新しい手法を提案する。
そこで本研究では,これらのシーンにおける再構成性能を評価するための新しいベンチマークとプロトコルを提案する。
論文 参考訳(メタデータ) (2022-05-25T17:59:53Z) - Efficient Textured Mesh Recovery from Multiple Views with Differentiable
Rendering [8.264851594332677]
マルチビュー画像からテクスチャメッシュを復元する手法を提案する。
学習ベース多視点ステレオアルゴリズムにより予測される深度との差を最小化することにより形状形状を最適化する。
形状や色に対する暗黙的なニューラル表現とは対照的に,物体の光と反射を共同で推定する物理ベース逆レンダリング方式を導入する。
論文 参考訳(メタデータ) (2022-05-25T03:33:55Z) - GeoFill: Reference-Based Image Inpainting of Scenes with Complex
Geometry [40.68659515139644]
参照誘導画像描画は、他の参照画像からのコンテンツを活用して画像画素を復元する。
我々は、単眼深度推定を利用して、カメラ間の相対的なポーズを予測し、その基準画像を異なる3次元再投影により目標に整列させる。
提案手法は,RealEstate10KとMannequinChallengeの両方のデータセットに対して,大規模なベースライン,複雑な幾何学,極端なカメラモーションによる最先端性能を実現する。
論文 参考訳(メタデータ) (2022-01-20T12:17:13Z) - Neural Radiance Fields Approach to Deep Multi-View Photometric Stereo [103.08512487830669]
多視点測光ステレオ問題(MVPS)に対する現代的な解法を提案する。
我々は、光度ステレオ(PS)画像形成モデルを用いて表面配向を取得し、それを多視点のニューラルラディアンス場表現とブレンドして物体の表面形状を復元する。
本手法は,多視点画像のニューラルレンダリングを行い,深部光度ステレオネットワークによって推定される表面の正規性を活用している。
論文 参考訳(メタデータ) (2021-10-11T20:20:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。