論文の概要: Reconstruct, Rasterize and Backprop: Dense shape and pose estimation
from a single image
- arxiv url: http://arxiv.org/abs/2004.12232v1
- Date: Sat, 25 Apr 2020 20:53:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-09 22:20:53.145184
- Title: Reconstruct, Rasterize and Backprop: Dense shape and pose estimation
from a single image
- Title(参考訳): 再構成・ラスタライズ・バックプロップ:単一画像からの高密度形状とポーズ推定
- Authors: Aniket Pokale, Aditya Aggarwal, K. Madhava Krishna
- Abstract要約: 本稿では,1枚の画像から6-DoFポーズとともに高密度物体再構成を行うシステムを提案する。
我々は、カメラフレームの3D再構成でループを閉じるために、差別化可能なレンダリング(特にロボティクス)の最近の進歩を活用している。
- 参考スコア(独自算出の注目度): 14.9851111159799
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a new system to obtain dense object reconstructions along
with 6-DoF poses from a single image. Geared towards high fidelity
reconstruction, several recent approaches leverage implicit surface
representations and deep neural networks to estimate a 3D mesh of an object,
given a single image. However, all such approaches recover only the shape of an
object; the reconstruction is often in a canonical frame, unsuitable for
downstream robotics tasks. To this end, we leverage recent advances in
differentiable rendering (in particular, rasterization) to close the loop with
3D reconstruction in camera frame. We demonstrate that our approach---dubbed
reconstruct, rasterize and backprop (RRB) achieves significantly lower pose
estimation errors compared to prior art, and is able to recover dense object
shapes and poses from imagery. We further extend our results to an (offline)
setup, where we demonstrate a dense monocular object-centric egomotion
estimation system.
- Abstract(参考訳): 本稿では,1枚の画像から6-DoFポーズとともに高密度物体再構成を行うシステムを提案する。
高忠実度再構築に向けて、最近のいくつかのアプローチでは、暗黙的な表面表現とディープニューラルネットワークを活用して、1つの画像からオブジェクトの3Dメッシュを推定している。
しかし、このようなアプローチはすべて物体の形状だけを復元するものであり、その復元はしばしば標準的なフレームで行われ、下流ロボットの作業には適さない。
この目的のために, 微分可能レンダリング(特にラスタライズ)の最近の進歩を利用して, カメラフレームの3次元再構成によりループを閉じる。
提案手法は,従来の手法に比べて有意に低いポーズ推定誤差を達成し,画像から高密度な物体形状やポーズを復元できることを実証する。
この結果をさらに(オフラインで)設定に拡張し、密度の高いモノクロオブジェクト中心のエゴモーション推定システムを示す。
関連論文リスト
- Floating No More: Object-Ground Reconstruction from a Single Image [33.34421517827975]
本研究では,3次元物体形状の再構成を目的とした新しい作業であるORG(Object Restruction with Ground)を紹介する。
提案手法では,2つのコンパクトなピクセルレベル表現を用いて,カメラ,オブジェクト,グラウンドの関係を表現している。
論文 参考訳(メタデータ) (2024-07-26T17:59:56Z) - 2L3: Lifting Imperfect Generated 2D Images into Accurate 3D [16.66666619143761]
マルチビュー(MV)3次元再構成は,生成したMV画像を一貫した3次元オブジェクトに融合させる,有望なソリューションである。
しかし、生成された画像は、通常、一貫性のない照明、不整合幾何学、スパースビューに悩まされ、復元の質が低下する。
本稿では, 内在的分解誘導, 過渡的モノ先行誘導, および3つの問題に対処するための視認性向上を活用する新しい3次元再構成フレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-29T02:30:31Z) - LIST: Learning Implicitly from Spatial Transformers for Single-View 3D
Reconstruction [5.107705550575662]
Listは、局所的およびグローバルな画像特徴を活用して、単一の画像から3Dオブジェクトの幾何学的および位相的構造を再構築する、新しいニューラルネットワークである。
合成画像と実世界の画像から3Dオブジェクトを再構成する際のモデルの有用性を示す。
論文 参考訳(メタデータ) (2023-07-23T01:01:27Z) - Reconstructing Hand-Held Objects from Monocular Video [95.06750686508315]
本稿では,モノクロ映像から手持ち物体を再構成する手法を提案する。
トレーニングされたネットワークによってオブジェクトの幾何学を直接予測する最近の多くの手法とは対照的に、提案手法ではオブジェクトに先行する学習を一切必要としない。
論文 参考訳(メタデータ) (2022-11-30T09:14:58Z) - Towards Non-Line-of-Sight Photography [48.491977359971855]
非視線イメージング(NLOS)は、隠された物体からの多重バウンス間接反射を捉えることに基づいている。
アクティブなNLOSイメージングシステムは、シーンを通しての光の飛行時間の捕捉に依存している。
我々はNLOS写真と呼ばれる新しい問題定式化を提案し、この欠陥に特に対処する。
論文 参考訳(メタデータ) (2021-09-16T08:07:13Z) - Black-Box Test-Time Shape REFINEment for Single View 3D Reconstruction [57.805334118057665]
文献中の任意のブラックボックス方式のパイプラインに容易に組み込むことができる後処理メッシュ改善ステップであるREFINEを提案する。
テスト時には、REFINEはメッシュ毎のネットワークインスタンスを最適化し、メッシュと所定のオブジェクトビュー間の一貫性を促進する。
論文 参考訳(メタデータ) (2021-08-23T03:28:47Z) - Shape from Blur: Recovering Textured 3D Shape and Motion of Fast Moving
Objects [115.71874459429381]
本研究では, 物体の3次元形状, テクスチャ, 動きを単一動画像から共同で再構成する新しい課題について述べる。
従来の手法では2次元画像領域でのみ遅延問題に対処するが、3次元領域における全ての物体特性の厳密なモデリングは任意の物体の動きの正確な記述を可能にする。
論文 参考訳(メタデータ) (2021-06-16T13:18:08Z) - From Points to Multi-Object 3D Reconstruction [71.17445805257196]
単一のRGB画像から複数の3Dオブジェクトを検出し再構成する方法を提案する。
キーポイント検出器は、オブジェクトを中心点としてローカライズし、9-DoF境界ボックスや3D形状を含む全てのオブジェクト特性を直接予測する。
提示されたアプローチは、軽量な再構築を単一ステージで実行し、リアルタイム能力を持ち、完全に微分可能で、エンドツーエンドのトレーナーブルである。
論文 参考訳(メタデータ) (2020-12-21T18:52:21Z) - A Divide et Impera Approach for 3D Shape Reconstruction from Multiple
Views [49.03830902235915]
物体の3次元形状を1つまたは複数の画像から推定することは、最近のディープラーニングによるブレークスルーによって人気を集めている。
本稿では,与えられた視点からの可視情報を統合することで,視点変化の再構築に頼ることを提案する。
提案手法を検証するために,相対的なポーズ推定と3次元形状再構成の観点から,ShapeNet参照ベンチマークの総合評価を行った。
論文 参考訳(メタデータ) (2020-11-17T09:59:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。