論文の概要: UniLiPs: Unified LiDAR Pseudo-Labeling with Geometry-Grounded Dynamic Scene Decomposition
- arxiv url: http://arxiv.org/abs/2601.05105v1
- Date: Thu, 08 Jan 2026 16:52:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 17:01:53.287195
- Title: UniLiPs: Unified LiDAR Pseudo-Labeling with Geometry-Grounded Dynamic Scene Decomposition
- Title(参考訳): UniLiPs: 幾何学型動的シーン分解を用いた統一LiDAR擬似ラベル化
- Authors: Filippo Ghilotti, Samuel Brucker, Nahku Saidy, Matteo Matteucci, Mario Bijelic, Felix Heide,
- Abstract要約: 自動運転の応用において、ラベルなしのLiDARログは、本質的には、平らな視界に隠れている密集した3D幾何学の金鉱である。
テキストと2Dビジョン基礎モデルから直接3Dへと持ち上げ、融合するために、LiDARスイープ間の時間的幾何学的整合性を活用することで、このボトルネックに対処する。
提案手法が既存のセマンティックセグメンテーションやオブジェクト検出擬似ラベル法と良好に比較できることを実験的に検証した。
- 参考スコア(独自算出の注目度): 38.91601218414532
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unlabeled LiDAR logs, in autonomous driving applications, are inherently a gold mine of dense 3D geometry hiding in plain sight - yet they are almost useless without human labels, highlighting a dominant cost barrier for autonomous-perception research. In this work we tackle this bottleneck by leveraging temporal-geometric consistency across LiDAR sweeps to lift and fuse cues from text and 2D vision foundation models directly into 3D, without any manual input. We introduce an unsupervised multi-modal pseudo-labeling method relying on strong geometric priors learned from temporally accumulated LiDAR maps, alongside with a novel iterative update rule that enforces joint geometric-semantic consistency, and vice-versa detecting moving objects from inconsistencies. Our method simultaneously produces 3D semantic labels, 3D bounding boxes, and dense LiDAR scans, demonstrating robust generalization across three datasets. We experimentally validate that our method compares favorably to existing semantic segmentation and object detection pseudo-labeling methods, which often require additional manual supervision. We confirm that even a small fraction of our geometrically consistent, densified LiDAR improves depth prediction by 51.5% and 22.0% MAE in the 80-150 and 150-250 meters range, respectively.
- Abstract(参考訳): 自動運転の応用において、ラベルなしのLiDARログは本質的には高密度な3D幾何学の金鉱であり、人間のラベルがなければほとんど役に立たない。
本研究は,LiDARスイープ間の時間的幾何学的整合性を活用して,テキストと2次元視覚基礎モデルから直接3Dへと持ち上げ,融合させることにより,このボトルネックに対処する。
本稿では、時間的に蓄積されたLiDARマップから学習した強力な幾何学的先入観に依存した教師なしマルチモーダル擬似ラベル法と、協調した幾何学的セマンティックな一貫性を強制する新しい反復的更新規則と、不整合から動く物体を検出する逆ヴァーサを導入する。
提案手法は,3つのデータセットにまたがる堅牢な一般化を実証し,同時に3次元セマンティックラベル,3次元バウンディングボックス,高密度LiDARスキャンを生成する。
提案手法は既存のセマンティックセグメンテーションとオブジェクト検出の擬似ラベル法とを良好に比較し,手動による監督を必要とする場合が多いことを実験的に検証した。
幾何的に一貫した密度のLiDARのごく一部でも,80-150mと150-250mでそれぞれ51.5%,22.0%の深度予測が向上することを確認した。
関連論文リスト
- ALISE: Annotation-Free LiDAR Instance Segmentation for Autonomous Driving [9.361724251990154]
アノテーションなしでLiDARインスタンスセグメンテーションを実行する新しいフレームワークであるALISEを紹介する。
我々のアプローチは、テキストと画像でガイドされたビジョンファウンデーションモデル(VFM)を用いて、初期の擬似ラベルを生成することから始まります。
そして、これらのラベルを、オフラインとオンラインの両方の最適化のために2Dと3Dのセマンティクスを組み合わせた専用の手動時間投票モジュールで洗練します。
この包括的な設計により、パフォーマンスが大幅に向上し、教師なしの3Dインスタンスセグメンテーションのための新しい最先端技術が確立される。
論文 参考訳(メタデータ) (2025-10-07T10:15:18Z) - Seg2Box: 3D Object Detection by Point-Wise Semantics Supervision [15.996707255179668]
LiDARに基づく3Dオブジェクト検出とセマンティックセグメンテーションは、3Dシーン理解において重要なタスクである。
従来の検出と方法は、バウンディングボックスラベルとセマンティックマスクラベルを通じてモデルを監督する。
本稿では,意味ラベルのみを用いた3次元物体検出を監督することにより,冗長性を解消することを目的とする。
論文 参考訳(メタデータ) (2025-03-21T02:39:32Z) - Approaching Outside: Scaling Unsupervised 3D Object Detection from 2D Scene [22.297964850282177]
教師なし3次元検出のためのLiDAR-2D Self-paced Learning (LiSe)を提案する。
RGB画像は、正確な2Dローカライゼーションキューを提供するLiDARデータの貴重な補完となる。
本フレームワークでは,適応型サンプリングと弱いモデルアグリゲーション戦略を組み込んだ自己評価学習パイプラインを考案する。
論文 参考訳(メタデータ) (2024-07-11T14:58:49Z) - Decoupled Pseudo-labeling for Semi-Supervised Monocular 3D Object Detection [108.672972439282]
SSM3ODに対するDPL(decoupled pseudo-labeling)アプローチを提案する。
提案手法は,擬似ラベルを効率的に生成するためのDPGモジュールを特徴とする。
また,擬似ラベルの雑音深度監視による最適化競合を軽減するために,DGPモジュールを提案する。
論文 参考訳(メタデータ) (2024-03-26T05:12:18Z) - Weakly Supervised Monocular 3D Object Detection using Multi-View
Projection and Direction Consistency [78.76508318592552]
モノクロ3Dオブジェクト検出は、その容易なアプリケーションのための自動駆動において、主流のアプローチとなっている。
現在のほとんどの方法は、トレーニングフェーズで使用される真実をラベル付けするために、まだ3Dポイントのクラウドデータに依存しています。
画像にマークされた2次元ラベルだけでモデルを訓練できる,弱教師付きモノクル3次元オブジェクト検出法を提案する。
論文 参考訳(メタデータ) (2023-03-15T15:14:00Z) - LIGA-Stereo: Learning LiDAR Geometry Aware Representations for
Stereo-based 3D Detector [80.7563981951707]
本稿では,LIGA-Stereoによるステレオ3次元検出器の学習について,LiDARに基づく検出モデルの高レベルな幾何認識表現の指導の下で提案する。
現状のステレオ検出器と比較して,車,歩行者,サイクリストの3次元検出性能は,それぞれ10.44%,5.69%,5.97%向上した。
論文 参考訳(メタデータ) (2021-08-18T17:24:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。