論文の概要: NeurAR: Neural Uncertainty for Autonomous 3D Reconstruction
- arxiv url: http://arxiv.org/abs/2207.10985v1
- Date: Fri, 22 Jul 2022 10:05:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-25 13:07:52.294024
- Title: NeurAR: Neural Uncertainty for Autonomous 3D Reconstruction
- Title(参考訳): ニューラル:自律的3次元再構成のための神経不確かさ
- Authors: Yunlong Ran, Jing Zeng, Shibo He, Lincheng Li, Yingfeng Chen, Gimhee
Lee, Jiming Chen, Qi Ye
- Abstract要約: 暗黙の神経表現はオフラインの3D再構成において魅力的な結果を示しており、オンラインSLAMシステムの可能性も最近示している。
本論文は,1)新しい表現に基づく視点計画の質を評価するための基準を求めること,2)手作りではなく,異なる場面に一般化可能なデータから基準を学習すること,の2つの課題に対処する。
本手法は, TSDFを用いた変形モデルやビュープランニングなしでの再構成モデルと比較した場合, レンダリングされた画像品質と再構成された3次元モデルの幾何学的品質について, 様々な指標について有意な改善を示す。
- 参考スコア(独自算出の注目度): 64.36535692191343
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Implicit neural representations have shown compelling results in offline 3D
reconstruction and also recently demonstrated the potential for online SLAM
systems. However, applying them to autonomous 3D reconstruction, where robots
are required to explore a scene and plan a view path for the reconstruction,
has not been studied. In this paper, we explore for the first time the
possibility of using implicit neural representations for autonomous 3D scene
reconstruction by addressing two key challenges: 1) seeking a criterion to
measure the quality of the candidate viewpoints for the view planning based on
the new representations, and 2) learning the criterion from data that can
generalize to different scenes instead of hand-crafting one. For the first
challenge, a proxy of Peak Signal-to-Noise Ratio (PSNR) is proposed to quantify
a viewpoint quality. The proxy is acquired by treating the color of a spatial
point in a scene as a random variable under a Gaussian distribution rather than
a deterministic one; the variance of the distribution quantifies the
uncertainty of the reconstruction and composes the proxy. For the second
challenge, the proxy is optimized jointly with the parameters of an implicit
neural network for the scene. With the proposed view quality criterion, we can
then apply the new representations to autonomous 3D reconstruction. Our method
demonstrates significant improvements on various metrics for the rendered image
quality and the geometry quality of the reconstructed 3D models when compared
with variants using TSDF or reconstruction without view planning.
- Abstract(参考訳): 暗黙の神経表現はオフラインの3D再構成において魅力的な結果を示し、オンラインSLAMシステムの可能性も最近示した。
しかし, ロボットが現場を探索し, 展望経路を計画する必要がある自律的3次元再構築に適用することは研究されていない。
本稿では,2つの課題に対処して,自律的3次元シーン再構成のための暗黙的ニューラルネットワーク表現の利用の可能性について初めて検討する。
1)新しい表現に基づく視点計画の候補視点の質を評価する基準を求めること
2)手作りではなく,様々な場面に一般化できるデータから基準を学習する。
最初の課題として、視点品質を定量化するために、ピーク信号対雑音比(PSNR)のプロキシを提案する。
シーン内の空間点の色を決定論的ではなくガウス分布下の確率変数として扱い、その分布の分散が再構成の不確かさを定量化し、プロキシを構成することにより、プロキシを取得する。
第2の課題として、プロキシはシーンの暗黙のニューラルネットワークのパラメータと共同で最適化される。
提案するビュー品質基準により,新たな表現を自律的3次元再構成に適用することができる。
本手法は,レンダリングされた画像品質および再構成した3次元モデルの形状品質について,tsdfや表示計画を用いない再構成法と比較して,様々な指標において有意な改善を示す。
関連論文リスト
- Frequency-based View Selection in Gaussian Splatting Reconstruction [9.603843571051744]
入力画像の少ない3次元ガウススプラッティング再構成を行うためのアクティブビュー選択の問題について検討する。
周波数領域の潜在的なビューをランク付けすることで、新しい視点の潜在的な情報ゲインを効果的に推定することができる。
提案手法は,画像による3次元再構成を効果的に行う可能性を示し,ビュー選択の最先端性を実現する。
論文 参考訳(メタデータ) (2024-09-24T21:44:26Z) - Improving Neural Indoor Surface Reconstruction with Mask-Guided Adaptive
Consistency Constraints [0.6749750044497732]
本稿では、ビュー依存色とビュー非依存色を分離する2段階のトレーニングプロセスを提案し、さらに2つの新しい一貫性制約を活用して、余分な事前処理を必要とせず、詳細な再構成性能を向上させる。
合成および実世界のデータセットの実験は、事前推定誤差から干渉を減らす能力を示している。
論文 参考訳(メタデータ) (2023-09-18T13:05:23Z) - Uncertainty Guided Policy for Active Robotic 3D Reconstruction using
Neural Radiance Fields [82.21033337949757]
本稿では,物体の暗黙のニューラル表現の各光線に沿ったカラーサンプルの重量分布のエントロピーを計算した線量不確実性推定器を提案する。
提案した推定器を用いた新しい視点から, 基礎となる3次元形状の不確かさを推測することが可能であることを示す。
ニューラルラディアンス場に基づく表現における線量不確実性によって導かれる次ベクター選択ポリシーを提案する。
論文 参考訳(メタデータ) (2022-09-17T21:28:57Z) - 2D GANs Meet Unsupervised Single-view 3D Reconstruction [21.93671761497348]
事前訓練されたGANに基づく制御可能な画像生成は、幅広いコンピュータビジョンタスクに役立てることができる。
本稿では,GAN生成した多視点画像から2次元の監視を活用できる新しい画像条件のニューラル暗黙界を提案する。
提案手法の有効性は,ジェネリックオブジェクトのより優れた1次元3次元再構成結果によって示される。
論文 参考訳(メタデータ) (2022-07-20T20:24:07Z) - MonoSDF: Exploring Monocular Geometric Cues for Neural Implicit Surface
Reconstruction [72.05649682685197]
最先端のニューラル暗黙法は、多くの入力ビューから単純なシーンの高品質な再構築を可能にする。
これは主に、十分な制約を提供していないRGB再構築損失の固有の曖昧さによって引き起こされる。
近年の単分子形状予測の分野での進歩に触発され, ニューラルな暗黙的表面再構成の改善にこれらの方法が役立つかを探究する。
論文 参考訳(メタデータ) (2022-06-01T17:58:15Z) - Multi-initialization Optimization Network for Accurate 3D Human Pose and
Shape Estimation [75.44912541912252]
我々はMulti-Initialization Optimization Network(MION)という3段階のフレームワークを提案する。
第1段階では,入力サンプルの2次元キーポイントに適合する粗い3次元再構成候補を戦略的に選択する。
第2段階では, メッシュ改質トランス (MRT) を設計し, 自己保持機構を用いて粗い再構成結果をそれぞれ洗練する。
最後に,RGB画像の視覚的証拠が与えられた3次元再構成と一致するかどうかを評価することで,複数の候補から最高の結果を得るために,一貫性推定ネットワーク(CEN)を提案する。
論文 参考訳(メタデータ) (2021-12-24T02:43:58Z) - Next-best-view Regression using a 3D Convolutional Neural Network [0.9449650062296823]
本論文では,次のベストビュー問題に対するデータ駆動アプローチを提案する。
提案手法は、次のベストビューのbtxtpositionを抑えるために、以前の再構成で3D畳み込みニューラルネットワークを訓練する。
提案手法を2つの実験グループを用いて検証した。
論文 参考訳(メタデータ) (2021-01-23T01:50:26Z) - Iterative Optimisation with an Innovation CNN for Pose Refinement [17.752556490937092]
本研究では,オブジェクトのポーズ推定を改良する手法として,Innovation CNNを提案する。
Innovation CNNを勾配降下フレームワークに反復的に適用することにより、初期ポーズ推定を段階的に改善する。
提案手法は,人気のLINEMODおよびOcclusion LINEMODデータセット上で評価し,両データセットの最先端性能を得る。
論文 参考訳(メタデータ) (2021-01-22T00:12:12Z) - Neural Descent for Visual 3D Human Pose and Shape [67.01050349629053]
入力RGB画像から3次元のポーズと形状を復元するディープニューラルネットワーク手法を提案する。
我々は最近導入された表現力のあるボディ統計モデルGHUMに頼っている。
我々の方法論の中心は、HUmanNeural Descent (HUND)と呼ばれるアプローチの学習と最適化である。
論文 参考訳(メタデータ) (2020-08-16T13:38:41Z) - PaMIR: Parametric Model-Conditioned Implicit Representation for
Image-based Human Reconstruction [67.08350202974434]
本研究では,パラメトリックボディモデルと自由形深部暗黙関数を組み合わせたパラメトリックモデル記述型暗黙表現(PaMIR)を提案する。
本手法は, 挑戦的なポーズや衣料品のタイプにおいて, 画像に基づく3次元再構築のための最先端性能を実現する。
論文 参考訳(メタデータ) (2020-07-08T02:26:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。