論文の概要: Category Level Object Pose Estimation via Neural Analysis-by-Synthesis
- arxiv url: http://arxiv.org/abs/2008.08145v1
- Date: Tue, 18 Aug 2020 20:30:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 21:47:42.047860
- Title: Category Level Object Pose Estimation via Neural Analysis-by-Synthesis
- Title(参考訳): ニューラル解析-合成によるカテゴリーレベルのオブジェクトポーズ推定
- Authors: Xu Chen, Zijian Dong, Jie Song, Andreas Geiger, Otmar Hilliges
- Abstract要約: 本稿では、勾配に基づくフィッティング法とパラメトリックニューラルネットワーク合成モジュールを組み合わせる。
画像合成ネットワークは、ポーズ設定空間を効率的に分散するように設計されている。
本研究では,2次元画像のみから高精度に物体の向きを復元できることを実験的に示す。
- 参考スコア(独自算出の注目度): 64.14028598360741
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many object pose estimation algorithms rely on the analysis-by-synthesis
framework which requires explicit representations of individual object
instances. In this paper we combine a gradient-based fitting procedure with a
parametric neural image synthesis module that is capable of implicitly
representing the appearance, shape and pose of entire object categories, thus
rendering the need for explicit CAD models per object instance unnecessary. The
image synthesis network is designed to efficiently span the pose configuration
space so that model capacity can be used to capture the shape and local
appearance (i.e., texture) variations jointly. At inference time the
synthesized images are compared to the target via an appearance based loss and
the error signal is backpropagated through the network to the input parameters.
Keeping the network parameters fixed, this allows for iterative optimization of
the object pose, shape and appearance in a joint manner and we experimentally
show that the method can recover orientation of objects with high accuracy from
2D images alone. When provided with depth measurements, to overcome scale
ambiguities, the method can accurately recover the full 6DOF pose successfully.
- Abstract(参考訳): 多くのオブジェクトポーズ推定アルゴリズムは、個々のオブジェクトインスタンスの明示的な表現を必要とする分析-合成フレームワークに依存している。
本稿では,物体のカテゴリ全体の外観,形状,ポーズを暗黙的に表現できるパラメトリック・ニューラル画像合成モジュールとグラデーションベースのフィッティング手順を組み合わせることで,オブジェクトインスタンスごとの明示的なCADモデルの必要性を解消する。
画像合成ネットワークは、ポーズ設定空間を効率よく分散して、モデルキャパシティを使用して、形状と局所的な外観(テクスチャ)の変動を一緒に捉えるように設計されている。
推測時には、合成画像は外観に基づく損失を介してターゲットと比較され、エラー信号はネットワークを介して入力パラメータに逆伝搬される。
ネットワークパラメータを固定し, 物体の姿勢, 形状, 外観を協調的に反復的に最適化することを可能にし, 2次元画像のみから高精度に物体の向きを復元できることを実験的に示す。
深度測定を施すと、スケールのあいまいさを克服し、フル6DOFのポーズを正確に再現することができる。
関連論文リスト
- FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects [55.77542145604758]
FoundationPoseは、6Dオブジェクトのポーズ推定と追跡のための統合基盤モデルである。
我々のアプローチは、微調整なしで、テスト時に新しいオブジェクトに即座に適用できる。
論文 参考訳(メタデータ) (2023-12-13T18:28:09Z) - GS-Pose: Category-Level Object Pose Estimation via Geometric and
Semantic Correspondence [5.500735640045456]
カテゴリーレベルのポーズ推定は、コンピュータビジョンやロボット工学における多くの潜在的な応用において難しい課題である。
本稿では,事前学習した基礎モデルから得られる幾何学的特徴と意味的特徴の両方を活用することを提案する。
これは、セマンティックな特徴がオブジェクトのテクスチャや外観に対して堅牢であるため、以前のメソッドよりもトレーニングするデータを大幅に少なくする。
論文 参考訳(メタデータ) (2023-11-23T02:35:38Z) - Diff-DOPE: Differentiable Deep Object Pose Estimation [29.703385848843414]
Diff-DOPE, 画像入力を行う6-DoFポーズ精細機, オブジェクトの3次元テクスチャモデル, オブジェクトの初期ポーズを紹介する。
この方法は、画像とモデルの投影の間の視覚的エラーを最小限に抑えるために、オブジェクトのポーズを更新するために微分可能なレンダリングを使用する。
このシンプルで効果的なアイデアは、ポーズ推定データセットで最先端の結果を得ることができることを示す。
論文 参考訳(メタデータ) (2023-09-30T18:52:57Z) - FrozenRecon: Pose-free 3D Scene Reconstruction with Frozen Depth Models [67.96827539201071]
本稿では,3次元シーン再構成のための新しいテスト時間最適化手法を提案する。
本手法は5つのゼロショットテストデータセット上で,最先端のクロスデータセット再構築を実現する。
論文 参考訳(メタデータ) (2023-08-10T17:55:02Z) - Learning to Complete Object Shapes for Object-level Mapping in Dynamic
Scenes [30.500198859451434]
本研究では,動的シーンにおけるオブジェクトの分割,追跡,再構築を同時に行うオブジェクトレベルのマッピングシステムを提案する。
さらに、深度入力とカテゴリレベルの前の形状からの再構成を条件にすることで、完全なジオメトリを予測し、完成させることができる。
実世界の合成シーケンスと実世界のシーケンスの両方で定量的に定性的にテストすることで,その有効性を評価する。
論文 参考訳(メタデータ) (2022-08-09T22:56:33Z) - Semantic keypoint-based pose estimation from single RGB frames [64.80395521735463]
一つのRGB画像からオブジェクトの連続6-DoFポーズを推定する手法を提案する。
このアプローチは、畳み込みネットワーク(convnet)によって予測されるセマンティックキーポイントと、変形可能な形状モデルを組み合わせる。
提案手法は,インスタンスベースのシナリオとクラスベースのシナリオの両方に対して,6-DoFオブジェクトのポーズを正確に復元できることを示す。
論文 参考訳(メタデータ) (2022-04-12T15:03:51Z) - Combining Local and Global Pose Estimation for Precise Tracking of
Similar Objects [2.861848675707602]
類似・非テクスチャオブジェクトに対する多目的6D検出・追跡パイプラインを提案する。
合成画像のみを訓練した新しいネットワークアーキテクチャは、複数のオブジェクトの同時ポーズ推定を可能にする。
建設現場における実際のAR支援アプリケーションにおいて,システムがどのように利用できるかを示す。
論文 参考訳(メタデータ) (2022-01-31T14:36:57Z) - Disentangled Implicit Shape and Pose Learning for Scalable 6D Pose
Estimation [44.8872454995923]
単一オートエンコーダを用いた複数オブジェクトの合成データに対する自己教師付き学習により,スケーラブルな6次元ポーズ推定のための新しい手法を提案する。
提案手法は,T-LESS と NOCS REAL275 という実データを持つ2つのマルチオブジェクトベンチマークで検証し,ポーズ推定精度と一般化の点で既存の RGB 法より優れていることを示す。
論文 参考訳(メタデータ) (2021-07-27T01:55:30Z) - Shape Prior Deformation for Categorical 6D Object Pose and Size
Estimation [62.618227434286]
RGB-D画像から見えないオブジェクトの6Dポーズとサイズを復元する新しい学習手法を提案する。
本研究では,事前学習したカテゴリ形状からの変形を明示的にモデル化することにより,3次元オブジェクトモデルを再構築するディープネットワークを提案する。
論文 参考訳(メタデータ) (2020-07-16T16:45:05Z) - PaMIR: Parametric Model-Conditioned Implicit Representation for
Image-based Human Reconstruction [67.08350202974434]
本研究では,パラメトリックボディモデルと自由形深部暗黙関数を組み合わせたパラメトリックモデル記述型暗黙表現(PaMIR)を提案する。
本手法は, 挑戦的なポーズや衣料品のタイプにおいて, 画像に基づく3次元再構築のための最先端性能を実現する。
論文 参考訳(メタデータ) (2020-07-08T02:26:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。