論文の概要: ALISE: Annotation-Free LiDAR Instance Segmentation for Autonomous Driving
- arxiv url: http://arxiv.org/abs/2510.05752v1
- Date: Tue, 07 Oct 2025 10:15:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-08 17:57:08.197681
- Title: ALISE: Annotation-Free LiDAR Instance Segmentation for Autonomous Driving
- Title(参考訳): ALISE: 自動運転のためのアノテーションなしLiDARインスタンスセグメンテーション
- Authors: Yongxuan Lyu, Guangfeng Jiang, Hongsi Liu, Jun Liu,
- Abstract要約: アノテーションなしでLiDARインスタンスセグメンテーションを実行する新しいフレームワークであるALISEを紹介する。
我々のアプローチは、テキストと画像でガイドされたビジョンファウンデーションモデル(VFM)を用いて、初期の擬似ラベルを生成することから始まります。
そして、これらのラベルを、オフラインとオンラインの両方の最適化のために2Dと3Dのセマンティクスを組み合わせた専用の手動時間投票モジュールで洗練します。
この包括的な設計により、パフォーマンスが大幅に向上し、教師なしの3Dインスタンスセグメンテーションのための新しい最先端技術が確立される。
- 参考スコア(独自算出の注目度): 9.361724251990154
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The manual annotation of outdoor LiDAR point clouds for instance segmentation is extremely costly and time-consuming. Current methods attempt to reduce this burden but still rely on some form of human labeling. To completely eliminate this dependency, we introduce ALISE, a novel framework that performs LiDAR instance segmentation without any annotations. The central challenge is to generate high-quality pseudo-labels in a fully unsupervised manner. Our approach starts by employing Vision Foundation Models (VFMs), guided by text and images, to produce initial pseudo-labels. We then refine these labels through a dedicated spatio-temporal voting module, which combines 2D and 3D semantics for both offline and online optimization. To achieve superior feature learning, we further introduce two forms of semantic supervision: a set of 2D prior-based losses that inject visual knowledge into the 3D network, and a novel prototype-based contrastive loss that builds a discriminative feature space by exploiting 3D semantic consistency. This comprehensive design results in significant performance gains, establishing a new state-of-the-art for unsupervised 3D instance segmentation. Remarkably, our approach even outperforms MWSIS, a method that operates with supervision from ground-truth (GT) 2D bounding boxes by a margin of 2.53% in mAP (50.95% vs. 48.42%).
- Abstract(参考訳): インスタンスセグメンテーションのための屋外LiDAR点雲のマニュアルアノテーションは非常に高価で時間を要する。
現在の手法はこの負担を減らそうとしているが、それでもある種の人間のラベル付けに依存している。
この依存関係を完全に排除するために、アノテーションなしでLiDARインスタンスセグメンテーションを実行する新しいフレームワークであるALISEを紹介します。
中心的な課題は、教師なしの方法で高品質な擬似ラベルを生成することである。
我々のアプローチは、テキストと画像でガイドされたビジョンファウンデーションモデル(VFM)を用いて、初期の擬似ラベルを生成することから始まります。
そして、これらのラベルを、オフラインとオンラインの両方の最適化のために2Dと3Dのセマンティクスを組み合わせた、専用の時空間投票モジュールを通じて洗練する。
優れた特徴学習を実現するために,3次元ネットワークに視覚的知識を注入する2次元先行的損失のセットと,3次元意味整合性を利用して識別的特徴空間を構築する新しいプロトタイプベースコントラスト的損失という,2種類の意味指導手法を導入する。
この包括的な設計により、パフォーマンスが大幅に向上し、教師なしの3Dインスタンスセグメンテーションのための新しい最先端技術が確立される。
これはGT2次元境界ボックスを2.53%のmAP(50.95%対48.42%)のマージンで制御する手法である。
関連論文リスト
- Integrating SAM Supervision for 3D Weakly Supervised Point Cloud Segmentation [66.65719382619538]
3Dセマンティックセグメンテーションの現在の手法では、大きな、不規則な、秩序のない3Dポイントクラウドデータの注釈付けの難しさに対処するため、限定アノテーション付きトレーニングモデルが提案されている。
本稿では,2次元基礎モデルから生成したセグメンテーションマスクを組み込んだ,疎可な3次元アノテーションの有用性を最大化する手法を提案する。
論文 参考訳(メタデータ) (2025-08-27T14:13:01Z) - 3D Can Be Explored In 2D: Pseudo-Label Generation for LiDAR Point Clouds Using Sensor-Intensity-Based 2D Semantic Segmentation [3.192308005611312]
そこで我々は,3次元セマンティックセマンティックセマンティクスパイプラインを導入し,アライメントシーンと最先端2次元セマンティクス手法を利用した。
本手法は,センサ強度で色付けされたLiDARスキャンから2次元ビューを生成し,これらのビューに2次元セマンティックセマンティックセグメンテーションを適用した。
分割された2D出力は3Dポイントにバックプロジェクターされ、単純な投票ベースの推定器が使用される。
論文 参考訳(メタデータ) (2025-05-06T08:31:32Z) - Label-Efficient LiDAR Panoptic Segmentation [22.440065488051047]
Limited-Label LiDAR Panoptic (L3PS)
我々は,アノテート画像からパノプティカルな擬似ラベルを生成するラベル効率のよい2Dネットワークを開発した。
次に、点雲の幾何学的性質を生かした新しい3Dリファインメントモジュールを導入する。
論文 参考訳(メタデータ) (2025-03-04T07:58:15Z) - Towards Modality-agnostic Label-efficient Segmentation with Entropy-Regularized Distribution Alignment [62.73503467108322]
この話題は、3次元の点雲のセグメンテーションで広く研究されている。
近年まで、擬似ラベルは、限られた地道ラベルによる訓練を容易にするために広く用いられてきた。
既存の擬似ラベリングアプローチは、重複しないデータのノイズやバリエーションに悩まされる可能性がある。
本研究では,学習用擬似ラベルを正規化し,擬似ラベルとモデル予測とのギャップを効果的に狭める学習戦略を提案する。
論文 参考訳(メタデータ) (2024-08-29T13:31:15Z) - 3D Annotation-Free Learning by Distilling 2D Open-Vocabulary Segmentation Models for Autonomous Driving [17.42913935045091]
2D textbf Open-textbfVocabulary セグメンテーションモデルを用いた新しい3D textbf Annotation-textbfFree フレームワーク AFOV を提案する。
第一段階では、2次元オープン語彙モデルの高品質テキストと画像の特徴を革新的に統合し、TMP(Tri-Modal contrastive Pre-training)を提案する。
第2段階では、点雲と画像の間の空間マッピングを利用して擬似ラベルを生成し、交差を可能にする。
論文 参考訳(メタデータ) (2024-05-24T07:18:09Z) - Decoupled Pseudo-labeling for Semi-Supervised Monocular 3D Object Detection [108.672972439282]
SSM3ODに対するDPL(decoupled pseudo-labeling)アプローチを提案する。
提案手法は,擬似ラベルを効率的に生成するためのDPGモジュールを特徴とする。
また,擬似ラベルの雑音深度監視による最適化競合を軽減するために,DGPモジュールを提案する。
論文 参考訳(メタデータ) (2024-03-26T05:12:18Z) - Image Understands Point Cloud: Weakly Supervised 3D Semantic
Segmentation via Association Learning [59.64695628433855]
ラベルのない画像から補完的な情報を取り入れた3次元セグメンテーションのための新しいクロスモダリティ弱教師付き手法を提案する。
基本的に、ラベルの小さな部分のパワーを最大化するために、アクティブなラベリング戦略を備えたデュアルブランチネットワークを設計する。
提案手法は,1%未満のアクティブなアノテーションで,最先端の完全教師付き競合よりも優れていた。
論文 参考訳(メタデータ) (2022-09-16T07:59:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。