論文の概要: Hierarchical Object Representation for Spatial Robot Perception: Points, Meshes, and Superquadrics
- arxiv url: http://arxiv.org/abs/2606.01545v1
- Date: Mon, 01 Jun 2026 01:45:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.858645
- Title: Hierarchical Object Representation for Spatial Robot Perception: Points, Meshes, and Superquadrics
- Title(参考訳): 空間ロボット知覚のための階層的オブジェクト表現:ポイント,メッシュ,スーパークワッドリック
- Authors: Ceng Zhang, Wan Su, Mohamed Samshad, Gregory S. Chirikjian, Rajat Talak,
- Abstract要約: 階層型3Dシーングラフ(3DSG)は、長期的な自律性のためのアクション可能でスケーラブルな表現として登場した。
高忠実度オブジェクトレベルの再構成に利用できる階層的オブジェクト表現を導入する。
提案手法は,現在最先端のオブジェクトベースのマップアライメント手法 ROMAN よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 7.735876865294663
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Hierarchical 3D Scene Graphs (3DSG) have emerged as an actionable and scalable representation for long-term autonomy incorporating metric, semantic, and topological information in the scene. However, the question of geometric representation of objects in 3DSG has been overlooked as most methods use simplified geometric models such as partial point clouds or 3D bounding boxes. In this work, we introduce a hierarchical object representation that can be leveraged for high-fidelity object-level reconstruction, object-based robust re-localization or map alignment, and efficient and analytical collision checking for safe robot navigation planning in dense and cluttered environments. The representation is structurally organized into four distinct layers, progressively abstracting the scene from raw sensor data to dense 3D meshes to analytical primitives such as superquadrics, which provide a sparse and analytical representation for object geometry. We develop a pipeline that builds the hierarchical object representation from RGB-D image stream captured by a robot, and demonstrate its working in real-world open-set object scenes in both indoor and outdoor environments. Extensive experiments across diverse datasets including HOPE, ReplicaCAD, Kimera-Multi, and NUS Campus Dataset collected using Unitree B2 Robot validate our pipeline in both indoor and outdoor environments. We show that our superquadric-based map alignment method outperforms the current state-of-the-art object based map alignment method ROMAN. Our code can be found at https://github.com/perceptica-robotics/Hickory.
- Abstract(参考訳): 階層型3Dシーングラフ(3DSG)は、計量、意味、トポロジ情報をシーンに組み込んだ長期的な自律性のためのアクション可能でスケーラブルな表現として登場した。
しかし、3DSGにおけるオブジェクトの幾何学的表現の問題は、ほとんどの手法が部分点雲や3D境界ボックスのような単純な幾何学的モデルを用いているため、見過ごされている。
本研究では,高忠実度オブジェクトレベルの再構成,オブジェクトベースのロバストな再局在化やマップアライメント,密集した環境下での安全なロボットナビゲーション計画のための効率的かつ解析的な衝突チェックなどに活用できる階層型オブジェクト表現を提案する。
この表現は4つの異なる層に構造的に整理され、シーンを生のセンサーデータから高密度の3Dメッシュへ徐々に抽象化し、スーパークワッドリックのような分析的プリミティブへと変換し、オブジェクト幾何学のスパースで分析的な表現を提供する。
我々は,ロボットが捉えたRGB-D画像ストリームから階層的オブジェクト表現を構築するパイプラインを開発し,室内環境と屋外環境の両方において,実際のオープンセットオブジェクトシーンで動作することを示す。
HOPE、ReplicaCAD、Kimera-Multi、NUS Campus Datasetといったさまざまなデータセットにわたる大規模な実験は、Unitree B2 Robotを使って収集され、私たちのパイプラインを屋内と屋外の両方の環境で検証しました。
提案手法は,現在最先端のオブジェクトベースのマップアライメント手法 ROMAN よりも優れていることを示す。
私たちのコードはhttps://github.com/perceptica-robotics/Hickory.comにある。
関連論文リスト
- Open-Vocabulary Indoor Object Grounding with 3D Hierarchical Scene Graph [0.0]
OVIGo-3DHSGは階層的なシーングラフ上の広い屋内環境を表す。
階層的表現は、床、部屋、場所、オブジェクト間の空間関係を明示的にモデル化する。
提案手法は,既存の手法と比較して,効率的なシーン理解とロバストなオブジェクトグラウンド化を実証する。
論文 参考訳(メタデータ) (2025-07-16T10:47:12Z) - Object-X: Learning to Reconstruct Multi-Modal 3D Object Representations [114.57192386025373]
Object-Xは多目的なマルチモーダル3D表現フレームワークである。
リッチなオブジェクトの埋め込みをエンコードして、幾何学的および視覚的再構成に復号することができる。
シーンアライメント、シングルイメージの3Dオブジェクト再構成、ローカライゼーションなど、さまざまなダウンストリームタスクをサポートする。
論文 参考訳(メタデータ) (2025-06-05T09:14:42Z) - 3D Part Segmentation via Geometric Aggregation of 2D Visual Features [57.20161517451834]
監督された3D部分分割モデルは、固定されたオブジェクトと部品のセットに合わせて調整されており、それらの転送可能性は、オープンセットの現実世界のシナリオに制限される。
近年、視覚言語モデル(VLM)を多視点レンダリングとテキストプロンプトを用いてオブジェクト部品の識別に活用する研究が進められている。
これらの制約に対処するために,視覚概念から抽出した意味論と3次元幾何学をブレンドし,対象部品を効果的に同定するCOPSを提案する。
論文 参考訳(メタデータ) (2024-12-05T15:27:58Z) - Open-Vocabulary Octree-Graph for 3D Scene Understanding [54.11828083068082]
Octree-Graphはオープンな3Dシーン理解のための新しいシーン表現である。
セマンティクスを記憶し、その形状に応じてオブジェクトの占有度を調節するアダプティブ・オクツリー構造を開発する。
論文 参考訳(メタデータ) (2024-11-25T10:14:10Z) - Multiview Scene Graph [7.460438046915524]
適切なシーン表現は、空間知性の追求の中心である。
未提示画像からマルチビューシーングラフ(MSG)を構築することを提案する。
MSGは、場所とオブジェクトノードを相互接続したシーンをトポロジ的に表現する。
論文 参考訳(メタデータ) (2024-10-15T02:04:05Z) - Flattening-Net: Deep Regular 2D Representation for 3D Point Cloud
Analysis [66.49788145564004]
我々は、任意の幾何学と位相の不規則な3次元点雲を表現するために、Flattning-Netと呼ばれる教師なしのディープニューラルネットワークを提案する。
我々の手法は、現在の最先端の競合相手に対して好意的に機能する。
論文 参考訳(メタデータ) (2022-12-17T15:05:25Z) - Object-level 3D Semantic Mapping using a Network of Smart Edge Sensors [25.393382192511716]
我々は,分散エッジセンサのネットワークとオブジェクトレベルの情報からなる多視点3次元意味マッピングシステムを拡張した。
提案手法は,数cm以内でのポーズ推定と,実験室環境におけるセンサネットワークを用いた実環境実験により,Behaveデータセットを用いて評価した。
論文 参考訳(メタデータ) (2022-11-21T11:13:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。