論文の概要: HS-Pose: Hybrid Scope Feature Extraction for Category-level Object Pose
Estimation
- arxiv url: http://arxiv.org/abs/2303.15743v1
- Date: Tue, 28 Mar 2023 05:36:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-29 16:22:30.131171
- Title: HS-Pose: Hybrid Scope Feature Extraction for Category-level Object Pose
Estimation
- Title(参考訳): HS-Pose:カテゴリーレベルのオブジェクト位置推定のためのハイブリッドスコープ特徴抽出
- Authors: Linfang Zheng, Chen Wang, Yinghan Sun, Esha Dasgupta, Hua Chen, Ales
Leonardis, Wei Zhang, Hyung Jin Chang
- Abstract要約: 本稿では,3D-GCを拡張したシンプルなネットワーク構造HS層を提案する。
提案するHS層は,1)局所的グローバルな幾何学構造とグローバルな情報,2)ノイズに頑健で,3)サイズや翻訳情報をエンコードできる。
実験の結果,ベースライン法(GPV-Pose)における3D-GC層とHS層を簡易に置き換えることにより,大幅な改善が得られた。
- 参考スコア(独自算出の注目度): 28.405005252559146
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this paper, we focus on the problem of category-level object pose
estimation, which is challenging due to the large intra-category shape
variation. 3D graph convolution (3D-GC) based methods have been widely used to
extract local geometric features, but they have limitations for complex shaped
objects and are sensitive to noise. Moreover, the scale and translation
invariant properties of 3D-GC restrict the perception of an object's size and
translation information. In this paper, we propose a simple network structure,
the HS-layer, which extends 3D-GC to extract hybrid scope latent features from
point cloud data for category-level object pose estimation tasks. The proposed
HS-layer: 1) is able to perceive local-global geometric structure and global
information, 2) is robust to noise, and 3) can encode size and translation
information. Our experiments show that the simple replacement of the 3D-GC
layer with the proposed HS-layer on the baseline method (GPV-Pose) achieves a
significant improvement, with the performance increased by 14.5% on 5d2cm
metric and 10.3% on IoU75. Our method outperforms the state-of-the-art methods
by a large margin (8.3% on 5d2cm, 6.9% on IoU75) on the REAL275 dataset and
runs in real-time (50 FPS).
- Abstract(参考訳): 本稿では,カテゴリー内形状の変化が大きいため,カテゴリレベルのオブジェクトポーズ推定の問題に焦点をあてる。
3次元グラフ畳み込み(3D-GC)に基づく手法は局所的な幾何学的特徴を抽出するために広く用いられているが、複雑な形状の物体には制限があり、ノイズに敏感である。
さらに、3D-GCのスケールと翻訳不変性は、物体のサイズと翻訳情報の知覚を制限する。
本稿では3D-GCを拡張して,カテゴリレベルのオブジェクトポーズ推定タスクのためのポイントクラウドデータからハイブリッドスコープ潜在特徴を抽出する,シンプルなネットワーク構造HS層を提案する。
HS層の提案
1)地域・グローバルな幾何学的構造とグローバルな情報を知覚することができる。
2)雑音に対して頑健であり,
3)サイズと翻訳情報をエンコードできる。
5d2cmで14.5%, IoU75で10.3%向上し, 3D-GC層をベースライン法(GPV-Pose)上のHS層に簡易に置き換えることにより, 大幅な改善が得られた。
提案手法はREAL275データセットにおいて,最先端の手法よりも大きなマージン(5d2cmが8.3%,IoU75が6.9%)で,リアルタイム(50FPS)で動作する。
関連論文リスト
- GALA: Geometry-Aware Local Adaptive Grids for Detailed 3D Generation [28.299293407423455]
GALAは複雑な幾何学や表面の細部を捉え再現する3次元形状の斬新な表現である。
最適化されたC++/CUDA実装では、GALAをオブジェクトに10秒以内で適用することができます。
幾何学的なディテールで3次元形状を生成することができるカスケード生成パイプラインを提供する。
論文 参考訳(メタデータ) (2024-10-13T22:53:58Z) - SAGS: Structure-Aware 3D Gaussian Splatting [53.6730827668389]
本研究では,シーンの形状を暗黙的に符号化する構造認識型ガウス散乱法(SAGS)を提案する。
SAGSは、最先端のレンダリング性能と、ベンチマークノベルビュー合成データセットのストレージ要件の削減を反映している。
論文 参考訳(メタデータ) (2024-04-29T23:26:30Z) - Learning Object-level Point Augmentor for Semi-supervised 3D Object
Detection [85.170578641966]
半教師付き3次元オブジェクト検出のための局所変換を行うオブジェクトレベルポイント拡張器(OPA)を提案する。
このようにして、結果のオーグメンタは、無関係なバックグラウンドではなく、オブジェクトインスタンスを強調するように導出されます。
ScanNetとSUN RGB-Dデータセットの実験は、提案したOPAが最先端の手法に対して好適に動作することを示している。
論文 参考訳(メタデータ) (2022-12-19T06:56:14Z) - CAGroup3D: Class-Aware Grouping for 3D Object Detection on Point Clouds [55.44204039410225]
本稿では,CAGroup3Dという新しい2段階完全スパース3Dオブジェクト検出フレームワークを提案する。
提案手法は,まず,オブジェクト表面のボクセル上でのクラス認識型局所群戦略を活用することによって,高品質な3D提案を生成する。
不正なボクセルワイドセグメンテーションにより欠落したボクセルの特徴を回復するために,完全にスパースな畳み込み型RoIプールモジュールを構築した。
論文 参考訳(メタデータ) (2022-10-09T13:38:48Z) - Single-stage Keypoint-based Category-level Object Pose Estimation from
an RGB Image [27.234658117816103]
カテゴリレベルのオブジェクトポーズ推定のための,単一段階のキーポイントに基づくアプローチを提案する。
提案ネットワークは2次元オブジェクト検出を行い、2次元キーポイントを検出し、6-DoFのポーズを推定し、相対的に有界な立方体次元を回帰する。
我々は,3次元IoU測定値における最先端の手法よりも優れた,挑戦的なObjectronベンチマークに関する広範囲な実験を行った。
論文 参考訳(メタデータ) (2021-09-13T17:55:00Z) - FS-Net: Fast Shape-based Network for Category-Level 6D Object Pose
Estimation with Decoupled Rotation Mechanism [49.89268018642999]
6次元ポーズ推定のための効率的なカテゴリレベルの特徴抽出が可能な高速形状ベースネットワーク(FS-Net)を提案する。
提案手法は,カテゴリレベルおよびインスタンスレベルの6Dオブジェクトのポーズ推定における最先端性能を実現する。
論文 参考訳(メタデータ) (2021-03-12T03:07:24Z) - Fine-Grained 3D Shape Classification with Hierarchical Part-View
Attentions [70.0171362989609]
本稿では,FG3D-Netと呼ばれる新しい3次元形状分類手法を提案する。
詳細な3次元形状データセットに基づく結果から,本手法が他の最先端手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-05-26T06:53:19Z) - ZoomNet: Part-Aware Adaptive Zooming Neural Network for 3D Object
Detection [69.68263074432224]
ステレオ画像に基づく3D検出のためのZoomNetという新しいフレームワークを提案する。
ZoomNetのパイプラインは、通常の2Dオブジェクト検出モデルから始まり、左右のバウンディングボックスのペアを取得するために使用される。
さらに,RGB画像のテクスチャキューを多用し,より正確な異質度推定を行うため,適応ズームという概念的に真直ぐなモジュールを導入する。
論文 参考訳(メタデータ) (2020-03-01T17:18:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。