論文の概要: ROS 2-Based LiDAR Perception Framework for Mobile Robots in Dynamic Production Environments, Utilizing Synthetic Data Generation, Transformation-Equivariant 3D Detection and Multi-Object Tracking
- arxiv url: http://arxiv.org/abs/2604.02109v1
- Date: Thu, 02 Apr 2026 14:45:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.862542
- Title: ROS 2-Based LiDAR Perception Framework for Mobile Robots in Dynamic Production Environments, Utilizing Synthetic Data Generation, Transformation-Equivariant 3D Detection and Multi-Object Tracking
- Title(参考訳): ROS 2-based LiDAR Perception Framework for Mobile Robots in Dynamic Production Environments, using Synthetic Data Generation, Transformation-equivariant 3D Detection and Multi-Object Tracking (特集:情報ネットワーク)
- Authors: Lukas Bergs, Tan Chung, Marmik Thakkar, Alexander Moriz, Amon Göppert, Chinnawut Nantabut, Robert Schmitt,
- Abstract要約: 本フレームワークは,合成データ学習時変3次元検出と多目的追跡センターポーズを統合した。
全体としては、スタンドアローンのポーズ推定で62.6%のユニオンのインターセクションが得られ、マルチオブジェクト追跡統合で83.12%まで上昇した。
- 参考スコア(独自算出の注目度): 33.72751145910978
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Adaptive robots in dynamic production environments require robust perception capabilities, including 6D pose estimation and multi-object tracking. To address limitations in real-world data dependency, noise robustness, and spatiotemporal consistency, a LiDAR framework based on the Robot Operating System integrating a synthetic-data-trained Transformation-Equivariant 3D Detection with multi-object-tracking leveraging center poses is proposed. Validated across 72 scenarios with motion capture technology, overall results yield an Intersection over Union of 62.6% for standalone pose estimation, rising to 83.12% with multi-object-tracking integration. Our LiDAR-based framework achieves 91.12% of Higher Order Tracking Accuracy, advancing robustness and versatility of LiDAR-based perception systems for industrial mobile manipulators.
- Abstract(参考訳): 動的生産環境での適応ロボットは、6Dポーズ推定や多目的追跡など、堅牢な知覚能力を必要とする。
実世界のデータ依存, ノイズの堅牢性, 時空間整合性の制約に対処するため, 合成データ学習型変換-等変3次元検出と多目的追従型中心ポーズを組み合わせたロボットオペレーティングシステムに基づくLiDARフレームワークを提案する。
モーションキャプチャ技術で72のシナリオにまたがって検証された結果、全体としては、スタンドアロンのポーズ推定において62.6%のユニオンのインターセクションが得られ、マルチオブジェクト追跡統合で83.12%まで上昇した。
我々のLiDARベースのフレームワークは、高次追跡精度の91.12%を達成し、産業用移動マニピュレータのためのLiDARベースの認識システムの堅牢性と汎用性を向上する。
関連論文リスト
- RoboMIND 2.0: A Multimodal, Bimanual Mobile Manipulation Dataset for Generalizable Embodied Intelligence [59.39508501733987]
本稿では,RoboMIND 2.0について紹介する。これは310K以上のデュアルアーム操作トラジェクトリからなる,総合的な実世界のデータセットである。
コンタクトリッチで空間的に拡張されたタスクの研究を支援するため、データセットには12Kの触覚強調エピソードと20Kの移動操作トラジェクトリが組み込まれている。
RoboMIND 2.0の可能性をフル活用するために、オフライン強化学習により最適化された階層型デュアルシステムフレームワークであるMIND-2システムを提案する。
論文 参考訳(メタデータ) (2025-12-31T05:59:40Z) - RoboTracer: Mastering Spatial Trace with Reasoning in Vision-Language Models for Robotics [53.053660003572965]
本稿では,3次元空間参照と計測の両方を初めて実現した3D対応VLMであるRoboTracerを提案する。
RoboTracerは、強化微調整により、多段階のメートル法推論を進める。
本稿では,空間的トレーシングを評価する上で困難なベンチマークであるTraceSpatial-Benchを提案する。
論文 参考訳(メタデータ) (2025-12-15T18:52:43Z) - Data-Driven Dynamic Parameter Learning of manipulator robots [0.8679862302950613]
動的パラメータ推定のためのトランスフォーマーに基づく手法を提案する。
データセットは、8,192個のロボットで構成され、慣性および摩擦特性は様々である。
我々のモデルは時間的および空間的依存の両方を効果的に捉えている。
論文 参考訳(メタデータ) (2025-12-09T16:15:58Z) - LM-MCVT: A Lightweight Multi-modal Multi-view Convolutional-Vision Transformer Approach for 3D Object Recognition [5.317624228510749]
ロボットアプリケーションにおける3次元物体認識を強化するために,軽量マルチモーダル・マルチビュー・コンボリューショナル・ビジョン・トランスフォーマネットワーク(LM-MCVT)を提案する。
提案手法を合成モデルNet40データセット上で評価し,95.6%の認識精度を実現する。
その結果,合成および実世界の3Dデータ間での3Dオブジェクト認識における手法の堅牢性を示す。
論文 参考訳(メタデータ) (2025-04-27T14:30:16Z) - Multi-Modal Data-Efficient 3D Scene Understanding for Autonomous Driving [58.16024314532443]
我々は、異なるLiDARスキャンからレーザービーム操作を統合するフレームワークであるLaserMix++を導入し、データ効率の学習を支援するためにLiDAR-カメラ対応を組み込んだ。
結果は、LaserMix++が完全に教師付き代替よりも優れており、5倍のアノテーションで同等の精度を実現していることを示している。
この大幅な進歩は、LiDARベースの3Dシーン理解システムにおける広範囲なラベル付きデータへの依存を減らすための半教師付きアプローチの可能性を示している。
論文 参考訳(メタデータ) (2024-05-08T17:59:53Z) - Domain and Modality Gaps for LiDAR-based Person Detection on Mobile
Robots [91.01747068273666]
本稿では,移動ロボットのシナリオに着目した既存のLiDAR人物検出装置について検討する。
実験は3Dと2D LiDARのセンサー間のモダリティのギャップだけでなく、運転と移動ロボットのシナリオ間の領域ギャップを回避している。
その結果、LiDARに基づく人物検出の実践的な洞察を与え、関連する移動ロボットの設計と応用に関する情報決定を容易にする。
論文 参考訳(メタデータ) (2021-06-21T16:35:49Z) - Learnable Online Graph Representations for 3D Multi-Object Tracking [156.58876381318402]
3D MOT問題に対する統一型学習型アプローチを提案します。
我々は、完全にトレーニング可能なデータアソシエーションにNeural Message Passing Networkを使用します。
AMOTAの65.6%の最先端性能と58%のIDスウィッチを達成して、公開可能なnuScenesデータセットに対する提案手法のメリットを示す。
論文 参考訳(メタデータ) (2021-04-23T17:59:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。