論文の概要: Technical Report for ICRA 2025 GOOSE 3D Semantic Segmentation Challenge: Adaptive Point Cloud Understanding for Heterogeneous Robotic Systems
- arxiv url: http://arxiv.org/abs/2506.06995v1
- Date: Sun, 08 Jun 2025 04:55:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-10 16:33:10.610517
- Title: Technical Report for ICRA 2025 GOOSE 3D Semantic Segmentation Challenge: Adaptive Point Cloud Understanding for Heterogeneous Robotic Systems
- Title(参考訳): ICRA 2025 GOOSE 3D Semantic Segmentation Challenge: Adaptive Point Cloud Understanding for Heterogeneous Robotic Systems
- Authors: Xiaoya Zhang,
- Abstract要約: この課題は、ロボットプラットフォームから収集された多様な非構造屋外環境からの3Dポイントクラウドのセマンティックセグメンテーションに焦点を当てている。
この問題は、Point Transformer v3と統合されたPoint Prompt Tuningの実装によって解決された。
このアプローチはmIoUで大幅なパフォーマンス向上を実現し、挑戦的なプラットフォームでは最大22.59%向上した。
- 参考スコア(独自算出の注目度): 3.090529106242154
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This technical report presents the implementation details of the winning solution for the ICRA 2025 GOOSE 3D Semantic Segmentation Challenge. This challenge focuses on semantic segmentation of 3D point clouds from diverse unstructured outdoor environments collected from multiple robotic platforms. This problem was addressed by implementing Point Prompt Tuning (PPT) integrated with Point Transformer v3 (PTv3) backbone, enabling adaptive processing of heterogeneous LiDAR data through platform-specific conditioning and cross-dataset class alignment strategies. The model is trained without requiring additional external data. As a result, this approach achieved substantial performance improvements with mIoU increases of up to 22.59% on challenging platforms compared to the baseline PTv3 model, demonstrating the effectiveness of adaptive point cloud understanding for field robotics applications.
- Abstract(参考訳): 本技術報告では,ICRA 2025 GOOSE 3Dセマンティックセマンティックセグメンテーションチャレンジの入賞ソリューションの実装について述べる。
この課題は、複数のロボットプラットフォームから収集された多様な非構造屋外環境からの3Dポイントクラウドのセマンティックセグメンテーションに焦点を当てる。
この問題は、Point Prompt Tuning (PPT) とPoint Transformer v3 (PTv3) のバックボーンを統合し、プラットフォーム固有の条件付けとクロスデータセットクラスアライメント戦略を通じて、異種LiDARデータの適応処理を可能にすることで解決された。
モデルは、追加の外部データを必要とせずにトレーニングされる。
その結果,mIoUはベースラインPTv3モデルに比べて22.59%向上し,適応点クラウド理解の有効性が示された。
関連論文リスト
- SPPSFormer: High-quality Superpoint-based Transformer for Roof Plane Instance Segmentation from Point Clouds [14.67024375365087]
変圧器は、ポイントクラウドの屋根面のインスタンスセグメンテーションにはほとんど使われていない。
既存のスーパーポイント変換器は、低品質のスーパーポイントを使用するため、限られた性能に悩まされる。
高品質なスーパーポイントが満足すべき2つの基準を確立し、それに対応する2段階のスーパーポイント生成プロセスを導入する。
論文 参考訳(メタデータ) (2025-05-30T11:23:16Z) - FLARES: Fast and Accurate LiDAR Multi-Range Semantic Segmentation [52.89847760590189]
3Dシーンの理解は、自動運転における重要な課題である。
近年の手法では、レンジビュー表現を利用して処理効率を向上している。
範囲ビューに基づくLiDARセマンティックセマンティックセグメンテーションのためのワークフローを再設計する。
論文 参考訳(メタデータ) (2025-02-13T12:39:26Z) - Point Transformer V3 Extreme: 1st Place Solution for 2024 Waymo Open Dataset Challenge in Semantic Segmentation [98.11452697097539]
この技術的レポートでは、2024年のオープンデータセットチャレンジのセマンティックセグメンテーショントラックの第一位ソリューションについて詳述する。
我々は,最先端のプラグアンドプレイトレーニングと推論技術を実装することで,ベンチマーク上でのポイントトランスフォーマーV3の性能を大幅に向上させた。
このアプローチによって、Openデータセットセグメンテーションのリーダボードのトップポジションが確保され、他のエントリよりも大幅に向上しました。
論文 参考訳(メタデータ) (2024-07-21T22:08:52Z) - 3D Adaptive Structural Convolution Network for Domain-Invariant Point Cloud Recognition [3.3748750222488657]
3D Adaptive Structure Convolution Network (3D-ASCN)は、3Dポイントクラウド認識のための最先端フレームワークである。
3次元畳み込みカーネル、構造木構造、および効果的な幾何学的特徴抽出のための適応近傍サンプリングを組み合わせる。
論文 参考訳(メタデータ) (2024-07-05T19:38:10Z) - Adaptive Point Transformer [88.28498667506165]
Adaptive Point Cloud Transformer (AdaPT) は、適応トークン選択機構によって強化された標準PTモデルである。
AdaPTは推論中のトークン数を動的に削減し、大きな点雲の効率的な処理を可能にする。
論文 参考訳(メタデータ) (2024-01-26T13:24:45Z) - Learning-Based Biharmonic Augmentation for Point Cloud Classification [79.13962913099378]
Biharmonic Augmentation (BA)は、新しくて効率的なデータ拡張技術である。
BAは、既存の3D構造にスムーズな非剛性変形を与えることにより、点雲データを多様化する。
本稿では,先進的なオンライン強化システムであるAdvTuneについて紹介する。
論文 参考訳(メタデータ) (2023-11-10T14:04:49Z) - AdaPoinTr: Diverse Point Cloud Completion with Adaptive Geometry-Aware
Transformers [94.11915008006483]
本稿では,ポイントクラウドの完了をセット・ツー・セットの翻訳問題として再定義する手法を提案する。
我々は、ポイントクラウド補完のためにTransformerエンコーダデコーダアーキテクチャを採用したPoinTrと呼ばれる新しいモデルを設計する。
本手法は,PCNで6.53 CD,ShapeNet-55で0.81 CD,現実世界のKITTIで0.392 MMDを実現する。
論文 参考訳(メタデータ) (2023-01-11T16:14:12Z) - Dual Adaptive Transformations for Weakly Supervised Point Cloud
Segmentation [78.6612285236938]
弱制御点雲分割のための新しいDATモデル(textbfDual textbfAdaptive textbfTransformations)を提案する。
我々は,大規模S3DISデータセットとScanNet-V2データセットの2つの人気バックボーンを用いたDATモデルの評価を行った。
論文 参考訳(メタデータ) (2022-07-19T05:43:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。