論文の概要: 3D-NVS: A 3D Supervision Approach for Next View Selection
- arxiv url: http://arxiv.org/abs/2012.01743v1
- Date: Thu, 3 Dec 2020 07:50:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-23 15:12:04.314420
- Title: 3D-NVS: A 3D Supervision Approach for Next View Selection
- Title(参考訳): 3D-NVS: 次のビュー選択のための3Dスーパービジョンアプローチ
- Authors: Kumar Ashutosh, Saurabh Kumar, Subhasis Chaudhuri
- Abstract要約: 次のベストビュー選択のための分類に基づくアプローチを提案する。
我々は、このタスクの監督信号をどのように確実に取得できるかを示す。
- 参考スコア(独自算出の注目度): 22.662440687566587
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a classification based approach for the next best view selection
and show how we can plausibly obtain a supervisory signal for this task. The
proposed approach is end-to-end trainable and aims to get the best possible 3D
reconstruction quality with a pair of passively acquired 2D views. The proposed
model consists of two stages: a classifier and a reconstructor network trained
jointly via the indirect 3D supervision from ground truth voxels. While
testing, the proposed method assumes no prior knowledge of the underlying 3D
shape for selecting the next best view. We demonstrate the proposed method's
effectiveness via detailed experiments on synthetic and real images and show
how it provides improved reconstruction quality than the existing state of the
art 3D reconstruction and the next best view prediction techniques.
- Abstract(参考訳): そこで本研究では,次の最良視点選択のための分類に基づく手法を提案する。
提案手法はエンドツーエンドのトレーニングが可能で,受動的に取得した2次元ビューを用いて,最高の3次元再構成品質を実現することを目的としている。
提案モデルは2つの段階から構成される: 分類器と再構成器ネットワークは, 地中真理ボクセルからの間接的な3D監視を通して共同で訓練される。
テスト中,提案手法は,次のベストビューを選択するための基礎となる3次元形状の事前知識を前提としない。
合成画像と実画像の詳細な実験により,提案手法の有効性を実証し,既存の3D再構成技術や次の最良のビュー予測技術よりも優れた再現性を実現する方法を示す。
関連論文リスト
- Gaussian Splatting: 3D Reconstruction and Novel View Synthesis, a Review [0.08823202672546056]
本稿では,新鮮で見えない視点の創出を含む3次元再構成技術について概説する。
ガウススティング法における最近の展開の概要として,入力型,モデル構造,出力表現,トレーニング戦略について概説する。
論文 参考訳(メタデータ) (2024-05-06T12:32:38Z) - RadOcc: Learning Cross-Modality Occupancy Knowledge through Rendering
Assisted Distillation [50.35403070279804]
マルチビュー画像を用いた3次元シーンの占有状況とセマンティクスを推定することを目的とした,新たな課題である3D占有予測手法を提案する。
本稿では,RandOccを提案する。Rendering Assisted distillation paradigm for 3D Occupancy prediction。
論文 参考訳(メタデータ) (2023-12-19T03:39:56Z) - Take-A-Photo: 3D-to-2D Generative Pre-training of Point Cloud Models [97.58685709663287]
生成事前学習は、2次元視覚における基本モデルの性能を高めることができる。
3Dビジョンでは、トランスフォーマーベースのバックボーンの過度な信頼性と、点雲の秩序のない性質により、生成前のトレーニングのさらなる発展が制限されている。
本稿では,任意の点クラウドモデルに適用可能な3D-to-2D生成事前学習法を提案する。
論文 参考訳(メタデータ) (2023-07-27T16:07:03Z) - 3D-LatentMapper: View Agnostic Single-View Reconstruction of 3D Shapes [0.0]
視覚変換器(ViT)の中間潜時空間と共同画像テキスト表現モデル(CLIP)を高速かつ効率的なシングルビュー再構成(SVR)に活用する新しいフレームワークを提案する。
本研究ではShapeNetV2データセットを用いてSOTA法との比較実験を行い,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2022-12-05T11:45:26Z) - Uncertainty-Driven Active Vision for Implicit Scene Reconstruction [31.890470553111122]
暗黙的なシーン再構成のための不確実性駆動型能動視覚アプローチを提案する。
本研究では,2次元または3次元の監督を用いて,シーンを正確に表現する占領型再構築手法を開発した。
論文 参考訳(メタデータ) (2022-10-03T14:45:54Z) - Uncertainty Guided Policy for Active Robotic 3D Reconstruction using
Neural Radiance Fields [82.21033337949757]
本稿では,物体の暗黙のニューラル表現の各光線に沿ったカラーサンプルの重量分布のエントロピーを計算した線量不確実性推定器を提案する。
提案した推定器を用いた新しい視点から, 基礎となる3次元形状の不確かさを推測することが可能であることを示す。
ニューラルラディアンス場に基づく表現における線量不確実性によって導かれる次ベクター選択ポリシーを提案する。
論文 参考訳(メタデータ) (2022-09-17T21:28:57Z) - A Simple Baseline for Multi-Camera 3D Object Detection [94.63944826540491]
周囲のカメラで3Dオブジェクトを検出することは、自動運転にとって有望な方向だ。
マルチカメラオブジェクト検出のための簡易ベースラインであるSimMODを提案する。
我々は, nuScenes の3次元オブジェクト検出ベンチマークにおいて, SimMOD の有効性を示す広範囲な実験を行った。
論文 参考訳(メタデータ) (2022-08-22T03:38:01Z) - NeurAR: Neural Uncertainty for Autonomous 3D Reconstruction [64.36535692191343]
暗黙の神経表現はオフラインの3D再構成において魅力的な結果を示しており、オンラインSLAMシステムの可能性も最近示している。
本論文は,1)新しい表現に基づく視点計画の質を評価するための基準を求めること,2)手作りではなく,異なる場面に一般化可能なデータから基準を学習すること,の2つの課題に対処する。
本手法は, TSDFを用いた変形モデルやビュープランニングなしでの再構成モデルと比較した場合, レンダリングされた画像品質と再構成された3次元モデルの幾何学的品質について, 様々な指標について有意な改善を示す。
論文 参考訳(メタデータ) (2022-07-22T10:05:36Z) - Improving 3D Object Detection with Channel-wise Transformer [58.668922561622466]
我々は手作りの最小限の設計で2段階の3Dオブジェクト検出フレームワーク(CT3D)を提案する。
CT3Dは、提案対応の埋め込みとチャンネルワイドコンテキストアグリゲーションを同時に行う。
これはKITTIテスト3D検出ベンチマークで中等車カテゴリーで81.77%のAPを達成した。
論文 参考訳(メタデータ) (2021-08-23T02:03:40Z) - Pose Estimation and 3D Reconstruction of Vehicles from Stereo-Images
Using a Subcategory-Aware Shape Prior [0.0]
物体やコンピュータビジョンの3D再構成は、移動ロボット自動運転など、多くのアプリケーションにとって必須条件である。
本研究の目的は,従来の形状観察から3次元物体の復元がいかに利益を得るかを示すことである。
論文 参考訳(メタデータ) (2021-07-22T19:47:49Z) - Next-best-view Regression using a 3D Convolutional Neural Network [0.9449650062296823]
本論文では,次のベストビュー問題に対するデータ駆動アプローチを提案する。
提案手法は、次のベストビューのbtxtpositionを抑えるために、以前の再構成で3D畳み込みニューラルネットワークを訓練する。
提案手法を2つの実験グループを用いて検証した。
論文 参考訳(メタデータ) (2021-01-23T01:50:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。