論文の概要: ICP-4D: Bridging Iterative Closest Point and LiDAR Panoptic Segmentation
- arxiv url: http://arxiv.org/abs/2512.18991v1
- Date: Mon, 22 Dec 2025 03:13:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.598564
- Title: ICP-4D: Bridging Iterative Closest Point and LiDAR Panoptic Segmentation
- Title(参考訳): ICP-4D: 反復クローズトポイントとLiDARパノプティブセグメンテーション
- Authors: Gyeongrok Oh, Youngdong Jang, Jonghyun Choi, Suk-Ju Kang, Guang Lin, Sangpil Kim,
- Abstract要約: ICP-4Dは、空間的および時間的推論をインスタンスレベルの点集合間の幾何学的関係を通して統一する訓練不要のフレームワークである。
雑音のあるインスタンス予測の下での相関を安定化するために、シンクホーンに基づくソフトマッチングを導入する。
SemanticKITTI と Panoptic nuScenes の2つの実験により,我々の手法が常に最先端の手法より優れていることを示す。
- 参考スコア(独自算出の注目度): 44.68614934602709
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Dominant paradigms for 4D LiDAR panoptic segmentation are usually required to train deep neural networks with large superimposed point clouds or design dedicated modules for instance association. However, these approaches perform redundant point processing and consequently become computationally expensive, yet still overlook the rich geometric priors inherently provided by raw point clouds. To this end, we introduce ICP-4D, a simple yet effective training-free framework that unifies spatial and temporal reasoning through geometric relations among instance-level point sets. Specifically, we apply the Iterative Closest Point (ICP) algorithm to directly associate temporally consistent instances by aligning the source and target point sets through the estimated transformation. To stabilize association under noisy instance predictions, we introduce a Sinkhorn-based soft matching. This exploits the underlying instance distribution to obtain accurate point-wise correspondences, resulting in robust geometric alignment. Furthermore, our carefully designed pipeline, which considers three instance types-static, dynamic, and missing-offers computational efficiency and occlusion-aware matching. Our extensive experiments across both SemanticKITTI and panoptic nuScenes demonstrate that our method consistently outperforms state-of-the-art approaches, even without additional training or extra point cloud inputs.
- Abstract(参考訳): 4D LiDARのパノプティブセグメンテーションのための支配的なパラダイムは、通常、大きな重畳された点雲を持つディープニューラルネットワークのトレーニングや、例えばアソシエーションのための専用のモジュールの設計に必要である。
しかし、これらの手法は冗長な点処理を行い、結果として計算コストが高くなるが、原点雲によって本質的に提供されるリッチな幾何学的先行性を見落としている。
この目的のために、実例レベルの点集合間の幾何学的関係を通して空間的および時間的推論を統一する、シンプルで効果的なトレーニング不要なフレームワークであるICP-4Dを導入する。
具体的には、反復クローズトポイント(ICP)アルゴリズムを用いて、推定された変換を通してソースとターゲットポイントセットを整列させることにより、時間的に一貫したインスタンスを直接関連付ける。
雑音のあるインスタンス予測の下での相関を安定化するために、シンクホーンに基づくソフトマッチングを導入する。
これにより、基礎となるインスタンス分布を利用して正確なポイントワイズ対応を得ることができ、ロバストな幾何学的アライメントが得られる。
さらに, 静的, 動的, 欠落する3つのインスタンスタイプを考慮し, 計算効率とオクルージョン・アウェア・マッチングを慎重に設計した。
SemanticKITTI と Panoptic nuScenes の双方にわたる広範な実験により、我々の手法は、追加のトレーニングや追加のポイントクラウド入力なしでも、常に最先端のアプローチより優れていることが示された。
関連論文リスト
- Adaptive Point-Prompt Tuning: Fine-Tuning Heterogeneous Foundation Models for 3D Point Cloud Analysis [51.37795317716487]
本稿では,パラメータの少ない事前学習モデルを微調整するAdaptive Point-Prompt Tuning (APPT)法を提案する。
局所幾何学を集約することで原点雲を点埋め込みに変換し、空間的特徴を捉える。
任意のモダリティのソース領域から3Dへの自己アテンションを校正するために,重みを点埋め込みモジュールと共有するプロンプトジェネレータを導入する。
論文 参考訳(メタデータ) (2025-08-30T06:02:21Z) - A Moment Matching-Based Method for Sparse and Noisy Point Cloud Registration [8.121132773789652]
モーメントマッチングに基づく登録フレームワークを提案する。
合成および実世界のデータセットの実験により、我々の手法は既存の手法よりも精度と堅牢性を達成することが示された。
提案手法はローカライズ性能を大幅に向上し,LiDARシステムに匹敵する結果が得られる。
論文 参考訳(メタデータ) (2025-08-04T08:31:53Z) - DiffCom: Decoupled Sparse Priors Guided Diffusion Compression for Point Clouds [54.96190721255167]
ロスシー圧縮は、ポイントクラウドをストレージの潜在ポイントに変換するためのオートエンコーダに依存している。
本稿では,特に低レベルにおいて高い復元品質を実現するための拡散型フレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-21T05:41:35Z) - A Consistency-Aware Spot-Guided Transformer for Versatile and Hierarchical Point Cloud Registration [9.609585217048664]
我々は整合性を考慮したスポット誘導変換器(CAST)を開発した。
CASTは、無関係な領域への干渉を避けるために、スポット誘導のクロスアテンションモジュールを組み込んでいる。
スパースキーポイントと高密度特徴の両方のための軽量な微細マッチングモジュールは、変換を正確に推定することができる。
論文 参考訳(メタデータ) (2024-10-14T08:48:25Z) - Mask4Former: Mask Transformer for 4D Panoptic Segmentation [13.99703660936949]
Mask4Formerは、セマンティックインスタンスのセグメンテーションとトラッキングを統合する最初のトランスフォーマーベースのアプローチである。
本モデルは,手作りの非学習型アソシエーション戦略に頼ることなく,その時間的アソシエーションのセマンティックインスタンスを直接予測する。
Mask4Formerは68.4 LSTQのスコアでSemanticTITIテストセットの最先端を達成している。
論文 参考訳(メタデータ) (2023-09-28T03:30:50Z) - Deep Confidence Guided Distance for 3D Partial Shape Registration [14.315501760755609]
部分的から部分的な3次元形状登録のための新しい非定型学習法を提案する。
本稿では,信頼誘導距離ネットワーク(CGD-net)を紹介し,点埋め込みと点雲間の空間距離との学習可能な類似性を融合させる。
論文 参考訳(メタデータ) (2022-01-27T08:40:05Z) - SPU-Net: Self-Supervised Point Cloud Upsampling by Coarse-to-Fine
Reconstruction with Self-Projection Optimization [52.20602782690776]
実際のスキャンされたスパースデータからトレーニング用の大規模なペアリングスパーススキャンポイントセットを得るのは高価で面倒です。
本研究では,SPU-Net と呼ばれる自己監視型点群アップサンプリングネットワークを提案する。
本研究では,合成データと実データの両方について様々な実験を行い,最先端の教師付き手法と同等の性能が得られることを示す。
論文 参考訳(メタデータ) (2020-12-08T14:14:09Z) - DyCo3D: Robust Instance Segmentation of 3D Point Clouds through Dynamic
Convolution [136.7261709896713]
本稿では,インスタンスの性質に応じて適切な畳み込みカーネルを生成するデータ駆動型アプローチを提案する。
提案手法はScanetNetV2とS3DISの両方で有望な結果が得られる。
また、現在の最先端よりも推論速度を25%以上向上させる。
論文 参考訳(メタデータ) (2020-11-26T14:56:57Z) - Quaternion Equivariant Capsule Networks for 3D Point Clouds [58.566467950463306]
本稿では,3次元回転と翻訳に同値な点雲を処理するための3次元カプセルモジュールを提案する。
カプセル間の動的ルーティングをよく知られたWeiszfeldアルゴリズムに接続する。
オペレーターに基づいて、ポーズから幾何学をアンタングルするカプセルネットワークを構築します。
論文 参考訳(メタデータ) (2019-12-27T13:51:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。