論文の概要: Resolving Symmetry Ambiguity in Correspondence-based Methods for Instance-level Object Pose Estimation
- arxiv url: http://arxiv.org/abs/2405.10557v1
- Date: Fri, 17 May 2024 05:48:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-20 16:52:18.085136
- Title: Resolving Symmetry Ambiguity in Correspondence-based Methods for Instance-level Object Pose Estimation
- Title(参考訳): インスタンスレベルのオブジェクトポース推定のための対応型手法における対称性の曖昧さの解消
- Authors: Yongliang Lin, Yongzhi Su, Sandeep Inuganti, Yan Di, Naeem Ajilforoushan, Hanqing Yang, Yu Zhang, Jason Rambach,
- Abstract要約: 物体表面を1対多の対応に基づいて符号化する対称認識曲面であるSymCodeを提案する。
また、問題の解決なしにオブジェクトの6Dポーズパラメータを直接回帰する高速なエンドツーエンドネットワークであるSymNetについても紹介する。
- 参考スコア(独自算出の注目度): 5.821462441570274
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Estimating the 6D pose of an object from a single RGB image is a critical task that becomes additionally challenging when dealing with symmetric objects. Recent approaches typically establish one-to-one correspondences between image pixels and 3D object surface vertices. However, the utilization of one-to-one correspondences introduces ambiguity for symmetric objects. To address this, we propose SymCode, a symmetry-aware surface encoding that encodes the object surface vertices based on one-to-many correspondences, eliminating the problem of one-to-one correspondence ambiguity. We also introduce SymNet, a fast end-to-end network that directly regresses the 6D pose parameters without solving a PnP problem. We demonstrate faster runtime and comparable accuracy achieved by our method on the T-LESS and IC-BIN benchmarks of mostly symmetric objects. Our source code will be released upon acceptance.
- Abstract(参考訳): 単一のRGB画像からオブジェクトの6Dポーズを推定することは、対称オブジェクトを扱う際にさらに困難になる重要なタスクである。
近年のアプローチでは、画像画素と3次元物体表面頂点の1対1対応性を確立するのが一般的である。
しかし、1対1対応の利用は対称対象に対するあいまいさをもたらす。
そこで本研究では,一対多対応に基づく物体表面の頂点を符号化し,一対一対応の曖昧さを解消する対称性対応曲面符号化SymCodeを提案する。
また、PnP問題を解くことなく、6Dポーズパラメータを直接回帰する高速なエンドツーエンドネットワークであるSymNetも導入する。
我々は、T-LESSおよびIC-BINベンチマークにおいて、ほとんどの対称オブジェクトの高速なランタイムと同等の精度を実現したことを示す。
ソースコードは受理後に公開されます。
関連論文リスト
- BOP-Distrib: Revisiting 6D Pose Estimation Benchmark for Better Evaluation under Visual Ambiguities [0.7499722271664147]
6次元ポーズ推定は、カメラの観察を最もよく説明する対象のポーズを決定することを目的としている。
現在、6次元ポーズ推定法は、その基礎となる真理アノテーションに対して、視覚的曖昧性は、グローバルなオブジェクト対称性にのみ関連していると考えるデータセット上でベンチマークされている。
本稿では,画像内の物体表面の視認性を考慮し,各画像に特有の6次元ポーズ分布を付加したデータセットのアノテート手法を提案する。
論文 参考訳(メタデータ) (2024-08-30T13:52:26Z) - DVMNet: Computing Relative Pose for Unseen Objects Beyond Hypotheses [59.51874686414509]
現在のアプローチは、多数の離散的なポーズ仮説を持つ連続的なポーズ表現を近似している。
本稿では,DVMNet(Deep Voxel Matching Network)を提案する。
提案手法は,最先端の手法に比べて計算コストの低い新しいオブジェクトに対して,より正確なポーズ推定を行う。
論文 参考訳(メタデータ) (2024-03-20T15:41:32Z) - MatchU: Matching Unseen Objects for 6D Pose Estimation from RGB-D Images [57.71600854525037]
RGB-D画像からの6次元ポーズ推定のためのFuse-Describe-Match戦略を提案する。
MatchUは、2Dテクスチャと6Dポーズ予測のための3D幾何学的手がかりを融合する汎用的なアプローチである。
論文 参考訳(メタデータ) (2024-03-03T14:01:03Z) - Coupled Iterative Refinement for 6D Multi-Object Pose Estimation [64.7198752089041]
既知の3DオブジェクトのセットとRGBまたはRGB-Dの入力画像から、各オブジェクトの6Dポーズを検出して推定する。
我々のアプローチは、ポーズと対応を緊密に結合した方法で反復的に洗練し、アウトレーヤを動的に除去して精度を向上させる。
論文 参考訳(メタデータ) (2022-04-26T18:00:08Z) - ES6D: A Computation Efficient and Symmetry-Aware 6D Pose Regression
Framework [19.759108851254844]
このフレームワークは、XYZNetと呼ばれる完全な畳み込みネットワークを用いて、RGB-Dデータからポイントワイズ機能を効率的に抽出するシンプルなアーキテクチャで設計されている。
YCB-VideoデータセットとT-LESSデータセットの実験は、提案フレームワークの最高精度と低計算コストにおいて、かなり優れた性能を示す。
論文 参考訳(メタデータ) (2022-04-03T14:04:14Z) - Robust Extrinsic Symmetry Estimation in 3D Point Clouds [4.416484585765027]
3次元点雲で表される物体の反射対称性面を検出することは、3次元コンピュータビジョンと幾何学処理の基本的な問題である。
本稿では,外乱や欠落部分に対して頑健な反射対称性の平面に対する統計的推定器に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-09-21T03:09:51Z) - Category Level Object Pose Estimation via Neural Analysis-by-Synthesis [64.14028598360741]
本稿では、勾配に基づくフィッティング法とパラメトリックニューラルネットワーク合成モジュールを組み合わせる。
画像合成ネットワークは、ポーズ設定空間を効率的に分散するように設計されている。
本研究では,2次元画像のみから高精度に物体の向きを復元できることを実験的に示す。
論文 参考訳(メタデータ) (2020-08-18T20:30:47Z) - SymmetryNet: Learning to Predict Reflectional and Rotational Symmetries
of 3D Shapes from Single-View RGB-D Images [26.38270361331076]
本稿では3次元物体の反射対称性と回転対称性の両方を予測できるエンドツーエンドのディープニューラルネットワークを提案する。
単視点RGB-D画像に基づく3次元対称性検出のベンチマークにも貢献する。
論文 参考訳(メタデータ) (2020-08-02T14:10:09Z) - Learning to Detect 3D Reflection Symmetry for Single-View Reconstruction [32.14605731030579]
単一のRGB画像からの3D再構成は、コンピュータビジョンにおいて難しい問題である。
従来の手法は通常データ駆動であり、不正確な3次元形状の復元と限定的な一般化能力をもたらす。
本稿では,人造物体によく見られる反射対称性の鏡面を初めて検出し,その対称性の画素内対応を見いだして深度マップを予測する。
論文 参考訳(メタデータ) (2020-06-17T17:58:59Z) - EPOS: Estimating 6D Pose of Objects with Symmetries [57.448933686429825]
1つのRGB入力から利用可能な3次元モデルを用いて、剛体物体の6次元ポーズを推定する新しい手法を提案する。
オブジェクトは、体系的な方法で対称性を許容するコンパクトな表面フラグメントによって表現される。
エンコーダデコーダネットワークを用いて,高密度サンプリング画素とフラグメントの対応性を予測する。
論文 参考訳(メタデータ) (2020-04-01T17:41:08Z) - Robust 6D Object Pose Estimation by Learning RGB-D Features [59.580366107770764]
本稿では、この局所最適問題を解くために、回転回帰のための離散連続的な新しい定式化を提案する。
我々はSO(3)の回転アンカーを均一にサンプリングし、各アンカーから目標への制約付き偏差を予測し、最適な予測を選択するための不確実性スコアを出力する。
LINEMOD と YCB-Video の2つのベンチマーク実験により,提案手法が最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-02-29T06:24:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。