論文の概要: SDFEst: Categorical Pose and Shape Estimation of Objects from RGB-D
using Signed Distance Fields
- arxiv url: http://arxiv.org/abs/2207.04880v1
- Date: Mon, 11 Jul 2022 13:53:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-12 15:40:35.062931
- Title: SDFEst: Categorical Pose and Shape Estimation of Objects from RGB-D
using Signed Distance Fields
- Title(参考訳): SDFEst: 符号付き距離場を用いたRGB-Dからの物体の分類と形状推定
- Authors: Leonard Bruns and Patric Jensfelt
- Abstract要約: RGB-D画像からのオブジェクトのポーズと形状推定のためのモジュールパイプラインを提案する。
生成型形状モデルと新しいネットワークを統合して,単一または複数ビューからの6次元ポーズと形状推定を可能にする。
我々は、合成データと実データの両方に関するいくつかの実験において、最先端手法に対するアプローチの利点を実証する。
- 参考スコア(独自算出の注目度): 5.71097144710995
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Rich geometric understanding of the world is an important component of many
robotic applications such as planning and manipulation. In this paper, we
present a modular pipeline for pose and shape estimation of objects from RGB-D
images given their category. The core of our method is a generative shape
model, which we integrate with a novel initialization network and a
differentiable renderer to enable 6D pose and shape estimation from a single or
multiple views. We investigate the use of discretized signed distance fields as
an efficient shape representation for fast analysis-by-synthesis optimization.
Our modular framework enables multi-view optimization and extensibility. We
demonstrate the benefits of our approach over state-of-the-art methods in
several experiments on both synthetic and real data. We open-source our
approach at https://github.com/roym899/sdfest.
- Abstract(参考訳): 世界の豊かな幾何学的理解は、計画や操作といった多くのロボット応用の重要な要素である。
本稿では,RGB-D画像からオブジェクトのポーズと形状を推定するためのモジュールパイプラインを提案する。
提案手法のコアは生成形状モデルであり,新しい初期化ネットワークと微分可能なレンダラーを統合し,単一のビューや複数ビューから6次元のポーズと形状推定を可能にする。
高速な解析・合成最適化のための効率的な形状表現として,離散化符号距離場を用いる。
モジュラーフレームワークはマルチビューの最適化と拡張性を可能にする。
人工データと実データの両方についていくつかの実験を行い,最先端手法に対するアプローチの利点を実証した。
私たちはアプローチをhttps://github.com/roym899/sdfestでオープンソース化しました。
関連論文リスト
- FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects [55.77542145604758]
FoundationPoseは、6Dオブジェクトのポーズ推定と追跡のための統合基盤モデルである。
我々のアプローチは、微調整なしで、テスト時に新しいオブジェクトに即座に適用できる。
論文 参考訳(メタデータ) (2023-12-13T18:28:09Z) - Towards Scalable Multi-View Reconstruction of Geometry and Materials [27.660389147094715]
本稿では,3次元シーンのカメラポーズ,オブジェクト形状,空間変化の両方向反射分布関数(svBRDF)のジョイントリカバリ手法を提案する。
入力は高解像度のRGBD画像であり、アクティブ照明用の点灯付き携帯型ハンドヘルドキャプチャシステムによってキャプチャされる。
論文 参考訳(メタデータ) (2023-06-06T15:07:39Z) - Shape, Pose, and Appearance from a Single Image via Bootstrapped
Radiance Field Inversion [54.151979979158085]
提案手法では,自然画像に対する基本的エンドツーエンド再構築フレームワークを導入し,正確な地平のポーズが得られない。
そこで,モデルが解の第一の推算を生成するハイブリッド・インバージョン・スキームを適用する。
当社のフレームワークでは,イメージを10ステップでデレンダリングすることが可能で,現実的なシナリオで使用することが可能です。
論文 参考訳(メタデータ) (2022-11-21T17:42:42Z) - Generative Category-Level Shape and Pose Estimation with Semantic
Primitives [27.692997522812615]
本稿では,1枚のRGB-D画像からカテゴリレベルのオブジェクト形状とポーズ推定を行う新しいフレームワークを提案する。
カテゴリ内変動に対処するために、様々な形状を統一された潜在空間にエンコードするセマンティックプリミティブ表現を採用する。
提案手法は,実世界のデータセットにおいて,SOTAのポーズ推定性能とより優れた一般化を実現する。
論文 参考訳(メタデータ) (2022-10-03T17:51:54Z) - Semantic keypoint-based pose estimation from single RGB frames [64.80395521735463]
一つのRGB画像からオブジェクトの連続6-DoFポーズを推定する手法を提案する。
このアプローチは、畳み込みネットワーク(convnet)によって予測されるセマンティックキーポイントと、変形可能な形状モデルを組み合わせる。
提案手法は,インスタンスベースのシナリオとクラスベースのシナリオの両方に対して,6-DoFオブジェクトのポーズを正確に復元できることを示す。
論文 参考訳(メタデータ) (2022-04-12T15:03:51Z) - DONet: Learning Category-Level 6D Object Pose and Size Estimation from
Depth Observation [53.55300278592281]
単一深度画像からカテゴリレベルの6次元オブジェクト・ポースとサイズ推定(COPSE)を提案する。
筆者らのフレームワークは,深度チャネルのみの物体のリッチな幾何学的情報に基づいて推論を行う。
我々のフレームワークは、ラベル付き現実世界の画像を必要とする最先端のアプローチと競合する。
論文 参考訳(メタデータ) (2021-06-27T10:41:50Z) - From Points to Multi-Object 3D Reconstruction [71.17445805257196]
単一のRGB画像から複数の3Dオブジェクトを検出し再構成する方法を提案する。
キーポイント検出器は、オブジェクトを中心点としてローカライズし、9-DoF境界ボックスや3D形状を含む全てのオブジェクト特性を直接予測する。
提示されたアプローチは、軽量な再構築を単一ステージで実行し、リアルタイム能力を持ち、完全に微分可能で、エンドツーエンドのトレーナーブルである。
論文 参考訳(メタデータ) (2020-12-21T18:52:21Z) - Nothing But Geometric Constraints: A Model-Free Method for Articulated
Object Pose Estimation [89.82169646672872]
本稿では,ロボットアームの関節構成を,モデルに先入観を持たずにRGBまたはRGB-D画像のシーケンスから推定する,教師なし視覚ベースシステムを提案する。
我々は,古典幾何学的定式化と深層学習を組み合わせることで,この課題を解決するために,極性多剛体制約を拡張した。
論文 参考訳(メタデータ) (2020-11-30T20:46:48Z) - NodeSLAM: Neural Object Descriptors for Multi-View Shape Reconstruction [4.989480853499916]
本稿では,新しい確率的・微分レンダリングエンジンとともに,効率的で最適化可能な多クラス学習オブジェクト記述子を提案する。
本フレームワークは,ロボットの把握・配置,拡張現実,第1次オブジェクトレベルSLAMシステムなど,複数の応用が可能な,正確で堅牢な3次元オブジェクト再構成を実現する。
論文 参考訳(メタデータ) (2020-04-09T11:09:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。