論文の概要: Uncertainty-aware 3D Object-Level Mapping with Deep Shape Priors
- arxiv url: http://arxiv.org/abs/2309.09118v1
- Date: Sun, 17 Sep 2023 00:48:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-19 17:22:36.473048
- Title: Uncertainty-aware 3D Object-Level Mapping with Deep Shape Priors
- Title(参考訳): 深部形状を優先した不確実性を考慮した3次元オブジェクトレベルマッピング
- Authors: Ziwei Liao, Jun Yang, Jingxing Qian, Angela P. Schoellig, Steven L.
Waslander
- Abstract要約: 未知のオブジェクトに対して高品質なオブジェクトレベルマップを再構築するフレームワークを提案する。
提案手法では,複数のRGB-D画像を入力として,高密度な3次元形状と検出対象に対する9-DoFポーズを出力する。
2つの新たな損失関数を通して形状を伝播し不確実性を生じさせる確率的定式化を導出する。
- 参考スコア(独自算出の注目度): 15.34487368683311
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D object-level mapping is a fundamental problem in robotics, which is
especially challenging when object CAD models are unavailable during inference.
In this work, we propose a framework that can reconstruct high-quality
object-level maps for unknown objects. Our approach takes multiple RGB-D images
as input and outputs dense 3D shapes and 9-DoF poses (including 3 scale
parameters) for detected objects. The core idea of our approach is to leverage
a learnt generative model for shape categories as a prior and to formulate a
probabilistic, uncertainty-aware optimization framework for 3D reconstruction.
We derive a probabilistic formulation that propagates shape and pose
uncertainty through two novel loss functions. Unlike current state-of-the-art
approaches, we explicitly model the uncertainty of the object shapes and poses
during our optimization, resulting in a high-quality object-level mapping
system. Moreover, the resulting shape and pose uncertainties, which we
demonstrate can accurately reflect the true errors of our object maps, can also
be useful for downstream robotics tasks such as active vision. We perform
extensive evaluations on indoor and outdoor real-world datasets, achieving
achieves substantial improvements over state-of-the-art methods. Our code will
be available at https://github.com/TRAILab/UncertainShapePose.
- Abstract(参考訳): 3Dオブジェクトレベルのマッピングはロボット工学の基本的な問題であり、推論中にオブジェクトCADモデルが利用できない場合、特に困難である。
本稿では,未知のオブジェクトに対して高品質なオブジェクトレベルマップを再構築するフレームワークを提案する。
提案手法では,複数のrgb-d画像を入力として,検出対象に対して密度の高い3d形状と9dofポーズ(3スケールパラメータを含む)を出力する。
このアプローチの核となる考え方は、3次元再構成のための確率的不確実性認識最適化フレームワークを定式化するために、事前の形状カテゴリの学習型生成モデルを活用することである。
形状を伝播し、2つの新しい損失関数を介して不確実性を示す確率的定式化を導出する。
現在の最先端のアプローチとは異なり、最適化中にオブジェクトの形状やポーズの不確かさを明示的にモデル化し、高品質なオブジェクトレベルのマッピングシステムを実現する。
さらに,オブジェクトマップの真の誤りを正確に反映できる形状やポーズの不確実性も,アクティブビジョンなどの下流ロボットタスクに有用であることを示す。
屋内および屋外の実世界のデータセットについて広範な評価を行い,最先端の手法よりも大幅な改善を達成している。
私たちのコードはhttps://github.com/trailab/uncertainshapeposeで利用可能です。
関連論文リスト
- FLARE: Feed-forward Geometry, Appearance and Camera Estimation from Uncalibrated Sparse Views [93.6881532277553]
FLAREは、高品質カメラのポーズと3次元幾何を、補正されていないスパースビュー画像から推定するために設計されたフィードフォワードモデルである。
本ソリューションでは,3次元構造を2次元画像平面にマッピングする上で,カメラポーズが重要なブリッジとして機能するケースケード学習パラダイムを特徴とする。
論文 参考訳(メタデータ) (2025-02-17T18:54:05Z) - LIST: Learning Implicitly from Spatial Transformers for Single-View 3D
Reconstruction [5.107705550575662]
Listは、局所的およびグローバルな画像特徴を活用して、単一の画像から3Dオブジェクトの幾何学的および位相的構造を再構築する、新しいニューラルネットワークである。
合成画像と実世界の画像から3Dオブジェクトを再構成する際のモデルの有用性を示す。
論文 参考訳(メタデータ) (2023-07-23T01:01:27Z) - Multi-view 3D Object Reconstruction and Uncertainty Modelling with
Neural Shape Prior [9.716201630968433]
セマンティックシーン理解には3次元オブジェクト再構成が重要である。
奥行き情報,閉塞音,ノイズの欠如により,単眼画像から詳細な3次元形状を復元することは困難である。
本研究では,3次元オブジェクトモデルの大規模データセットから物体形状分布を学習し,潜在空間にマッピングするニューラルオブジェクト表現を活用することで,この問題に対処する。
本稿では,その表現の一部として不確実性をモデル化し,個々の入力画像から直接不確実性コードを生成する不確実性認識エンコーダを定義する手法を提案する。
論文 参考訳(メタデータ) (2023-06-17T03:25:13Z) - 3D Surface Reconstruction in the Wild by Deforming Shape Priors from
Synthetic Data [24.97027425606138]
1枚の画像から被写体の3次元表面を再構築することは難しい問題である。
本稿では,1枚の画像から3次元合成とオブジェクトポーズ推定を行う新しい手法を提案する。
提案手法は,複数の実世界のデータセットにまたがって,最先端の再構築性能を実現する。
論文 参考訳(メタデータ) (2023-02-24T20:37:27Z) - 3D Neural Embedding Likelihood: Probabilistic Inverse Graphics for
Robust 6D Pose Estimation [50.15926681475939]
逆グラフィックスは2次元画像から3次元シーン構造を推論することを目的としている。
確率モデルを導入し,不確実性を定量化し,6次元ポーズ推定タスクにおけるロバスト性を実現する。
3DNELは、RGBから学んだニューラルネットワークの埋め込みと深度情報を組み合わせることで、RGB-D画像からのsim-to-real 6Dオブジェクトのポーズ推定の堅牢性を向上させる。
論文 参考訳(メタデータ) (2023-02-07T20:48:35Z) - FvOR: Robust Joint Shape and Pose Optimization for Few-view Object
Reconstruction [37.81077373162092]
数枚の画像から正確な3Dオブジェクトモデルを再構築することは、コンピュータビジョンにおいて難しい問題である。
FvORは、ノイズの多い入力ポーズを持つ数枚の画像から正確な3Dモデルを予測する学習ベースのオブジェクト再構成手法である。
論文 参考訳(メタデータ) (2022-05-16T15:39:27Z) - RandomRooms: Unsupervised Pre-training from Synthetic Shapes and
Randomized Layouts for 3D Object Detection [138.2892824662943]
有望な解決策は、CADオブジェクトモデルで構成される合成データセットをよりよく利用して、実際のデータセットでの学習を促進することである。
最近の3次元事前学習の研究は、合成物体から他の実世界の応用へ学習した伝達特性が失敗することを示している。
本研究では,この目的を達成するためにRandomRoomsという新しい手法を提案する。
論文 参考訳(メタデータ) (2021-08-17T17:56:12Z) - Secrets of 3D Implicit Object Shape Reconstruction in the Wild [92.5554695397653]
コンピュータビジョン、ロボティクス、グラフィックスの様々な用途において、高精細な3Dオブジェクトをスパースから再構築することは重要です。
最近の神経暗黙的モデリング法は、合成データセットまたは高密度データセットで有望な結果を示す。
しかし、粗末でノイズの多い実世界のデータではパフォーマンスが悪い。
本論文では, 一般的な神経暗黙モデルの性能低下の根本原因を解析する。
論文 参考訳(メタデータ) (2021-01-18T03:24:48Z) - From Points to Multi-Object 3D Reconstruction [71.17445805257196]
単一のRGB画像から複数の3Dオブジェクトを検出し再構成する方法を提案する。
キーポイント検出器は、オブジェクトを中心点としてローカライズし、9-DoF境界ボックスや3D形状を含む全てのオブジェクト特性を直接予測する。
提示されたアプローチは、軽量な再構築を単一ステージで実行し、リアルタイム能力を持ち、完全に微分可能で、エンドツーエンドのトレーナーブルである。
論文 参考訳(メタデータ) (2020-12-21T18:52:21Z) - Implicit Functions in Feature Space for 3D Shape Reconstruction and
Completion [53.885984328273686]
Implicit Feature Networks (IF-Nets) は連続的な出力を提供し、複数のトポロジを扱える。
IF-NetsはShapeNetにおける3次元オブジェクト再構成における先行作業よりも明らかに優れており、より正確な3次元人間の再構成が得られる。
論文 参考訳(メタデータ) (2020-03-03T11:14:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。