論文の概要: PIRATR: Parametric Object Inference for Robotic Applications with Transformers in 3D Point Clouds
- arxiv url: http://arxiv.org/abs/2602.05557v1
- Date: Thu, 05 Feb 2026 11:29:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:08.905854
- Title: PIRATR: Parametric Object Inference for Robotic Applications with Transformers in 3D Point Clouds
- Title(参考訳): PIRATR:3次元点雲における変圧器を用いたロボット応用のためのパラメトリックオブジェクト推論
- Authors: Michael Schwingshackl, Fabio F. Oberweger, Mario Niedermeyer, Huemer Johannes, Markus Murschitz,
- Abstract要約: PIRATRは、ポイントクラウドにおけるロボットユースケースのためのエンドツーエンドの3Dオブジェクト検出フレームワークである。
提案手法は,複数クラス6-DoFポーズとクラス固有のパラメトリック属性を同時推定することにより,パラメトリックな3次元物体検出を効率化する。
PIRATRは実際の屋外LiDARスキャンに効果的に一般化し、追加の微調整なしで0.919の検出mAPを達成する。
- 参考スコア(独自算出の注目度): 0.9134244356393665
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We present PIRATR, an end-to-end 3D object detection framework for robotic use cases in point clouds. Extending PI3DETR, our method streamlines parametric 3D object detection by jointly estimating multi-class 6-DoF poses and class-specific parametric attributes directly from occlusion-affected point cloud data. This formulation enables not only geometric localization but also the estimation of task-relevant properties for parametric objects, such as a gripper's opening, where the 3D model is adjusted according to simple, predefined rules. The architecture employs modular, class-specific heads, making it straightforward to extend to novel object types without re-designing the pipeline. We validate PIRATR on an automated forklift platform, focusing on three structurally and functionally diverse categories: crane grippers, loading platforms, and pallets. Trained entirely in a synthetic environment, PIRATR generalizes effectively to real outdoor LiDAR scans, achieving a detection mAP of 0.919 without additional fine-tuning. PIRATR establishes a new paradigm of pose-aware, parameterized perception. This bridges the gap between low-level geometric reasoning and actionable world models, paving the way for scalable, simulation-trained perception systems that can be deployed in dynamic robotic environments. Code available at https://github.com/swingaxe/piratr.
- Abstract(参考訳): PIRATRは、ポイントクラウドにおけるロボットユースケースのためのエンドツーエンドの3Dオブジェクト検出フレームワークである。
PI3DETRを拡張して,マルチクラス6-DoFポーズとクラス固有のパラメトリック属性を,オクルージョン影響の点群から直接推定することにより,パラメトリックな3次元物体検出を効率化する。
この定式化により、幾何学的局所化だけでなく、グリッパーの開口のようなパラメトリックな物体のタスク関連特性の推定が可能となり、そこでは3Dモデルが単純で事前定義された規則に従って調整される。
アーキテクチャはモジュール型のクラス固有のヘッドを採用しており、パイプラインを再設計することなく、新しいオブジェクトタイプに簡単に拡張できる。
我々はPIRATRを自動フォークリフトプラットフォームで検証し、クレーングリップパー、ローディングプラットフォーム、パレットの3つの構造的および機能的に多様なカテゴリに焦点を当てた。
完全に合成環境で訓練されたPIRATRは、実際の屋外LiDARスキャンに効果的に一般化し、追加の微調整なしで0.919の検出mAPを達成する。
PIRATRは、ポーズを認識し、パラメータ化された知覚の新しいパラダイムを確立する。
これは低レベルの幾何学的推論と行動可能な世界モデルの間のギャップを埋め、動的ロボット環境に展開できるスケーラブルでシミュレーションされた知覚システムへの道を開く。
コードはhttps://github.com/swingaxe/piratr.comで公開されている。
関連論文リスト
- PLANA3R: Zero-shot Metric Planar 3D Reconstruction via Feed-Forward Planar Splatting [56.188624157291024]
提案するPLANA3Rは,提案しない2次元画像から平面3次元再構成を計測するためのポーズレスフレームワークである。
トレーニング中に3次元平面アノテーションを必要とする以前のフィードフォワード法とは異なり、PLANA3Rは明確な平面監督なしで平面3次元構造を学習する。
本研究は,複数の室内環境データセットに対するPLANA3Rの有効性を検証するとともに,領域外屋内環境への強力な一般化を実証する。
論文 参考訳(メタデータ) (2025-10-21T15:15:33Z) - PI3DETR: Parametric Instance Detection of 3D Point Cloud Edges with a Geometry-Aware 3DETR [0.0]
本稿では,原点雲から3次元パラメトリック曲線を直接予測するエンドツーエンドフレームワークPI3DETRを提案する。
PI3DETRはABCデータセットに新たな最先端技術を設定し、実際のセンサデータに効果的に一般化し、3Dエッジと曲線推定のためのシンプルで強力なソリューションを提供する。
論文 参考訳(メタデータ) (2025-09-03T12:24:25Z) - Adaptive Point-Prompt Tuning: Fine-Tuning Heterogeneous Foundation Models for 3D Point Cloud Analysis [51.37795317716487]
本稿では,パラメータの少ない事前学習モデルを微調整するAdaptive Point-Prompt Tuning (APPT)法を提案する。
局所幾何学を集約することで原点雲を点埋め込みに変換し、空間的特徴を捉える。
任意のモダリティのソース領域から3Dへの自己アテンションを校正するために,重みを点埋め込みモジュールと共有するプロンプトジェネレータを導入する。
論文 参考訳(メタデータ) (2025-08-30T06:02:21Z) - Robust 3D Object Detection using Probabilistic Point Clouds from Single-Photon LiDARs [29.92823252627008]
LiDARベースの3Dセンサーは、様々なシーン理解タスクで使用される標準的な3D表現である点雲を提供する。
現代のLiDARは、長距離や低アルベドオブジェクトのようないくつかの現実のシナリオで課題に直面し、スパースや誤点雲を発生させる。
本稿では,各点を確率属性で拡張した新しい3次元シーン表現である確率点雲(PPC)を提案する。
論文 参考訳(メタデータ) (2025-07-31T21:32:21Z) - 3D-CDRGP: Towards Cross-Device Robotic Grasping Policy in 3D Open World [20.406334587479623]
デバイス間の研究は緊急の課題となり、取り組まなければならない。
私たちは、3Dオープンワールドにおけるクロスデバイス(カメラとロボティクス)の把握政策の先駆者です。
SSGC-Segモジュールは,カテゴリに依存しない3Dオブジェクト検出を可能にする。
論文 参考訳(メタデータ) (2024-11-27T08:23:28Z) - Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - ParaPoint: Learning Global Free-Boundary Surface Parameterization of 3D Point Clouds [52.03819676074455]
ParaPointは、グローバルな自由境界面パラメータ化を実現するための教師なしのニューラルネットワークパイプラインである。
この研究は、グローバルマッピングと自由境界の両方を追求するニューラルポイントクラウドパラメータ化を調査する最初の試みである。
論文 参考訳(メタデータ) (2024-03-15T14:35:05Z) - Hierarchical Point Attention for Indoor 3D Object Detection [111.04397308495618]
本研究は、点ベース変圧器検出器の汎用階層設計として、2つの新しい注意操作を提案する。
まず、よりきめ細かい特徴学習を可能にするために、シングルスケールの入力機能からマルチスケールトークンを構築するマルチスケール注意(MS-A)を提案する。
第2に,適応型アテンション領域を持つサイズ適応型ローカルアテンション(Local-A)を提案する。
論文 参考訳(メタデータ) (2023-01-06T18:52:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。