論文の概要: Towards Auto-Annotation from Annotation Guidelines: A Benchmark through 3D LiDAR Detection
- arxiv url: http://arxiv.org/abs/2506.02914v1
- Date: Tue, 03 Jun 2025 14:17:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:35.78318
- Title: Towards Auto-Annotation from Annotation Guidelines: A Benchmark through 3D LiDAR Detection
- Title(参考訳): アノテーションガイドラインからの自動アノテーションへ:3次元LiDAR検出によるベンチマーク
- Authors: Yechi Ma, Wei Hua, Shu Kong,
- Abstract要約: AnnoGuideは、専門家定義のアノテーションガイドラインから直接、データアノテーションの自動メソッドを評価することを目的としている。
これは、3Dアノテーションを使わずに、マルチモーダルな小ショット3D検出という新しいタスクである。
この結果から、AnnoGuideは依然としてオープンで困難な問題であり、LiDARベースのFMの開発を急務に必要としていることがうかがえる。
- 参考スコア(独自算出の注目度): 12.532548019177604
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A crucial yet under-appreciated prerequisite in machine learning solutions for real-applications is data annotation: human annotators are hired to manually label data according to detailed, expert-crafted guidelines. This is often a laborious, tedious, and costly process. To study methods for facilitating data annotation, we introduce a new benchmark AnnoGuide: Auto-Annotation from Annotation Guidelines. It aims to evaluate automated methods for data annotation directly from expert-defined annotation guidelines, eliminating the need for manual labeling. As a case study, we repurpose the well-established nuScenes dataset, commonly used in autonomous driving research, which provides comprehensive annotation guidelines for labeling LiDAR point clouds with 3D cuboids across 18 object classes. These guidelines include a few visual examples and textual descriptions, but no labeled 3D cuboids in LiDAR data, making this a novel task of multi-modal few-shot 3D detection without 3D annotations. The advances of powerful foundation models (FMs) make AnnoGuide especially timely, as FMs offer promising tools to tackle its challenges. We employ a conceptually straightforward pipeline that (1) utilizes open-source FMs for object detection and segmentation in RGB images, (2) projects 2D detections into 3D using known camera poses, and (3) clusters LiDAR points within the frustum of each 2D detection to generate a 3D cuboid. Starting with a non-learned solution that leverages off-the-shelf FMs, we progressively refine key components and achieve significant performance improvements, boosting 3D detection mAP from 12.1 to 21.9! Nevertheless, our results highlight that AnnoGuide remains an open and challenging problem, underscoring the urgent need for developing LiDAR-based FMs. We release our code and models at GitHub: https://annoguide.github.io/annoguide3Dbenchmark
- Abstract(参考訳): リアルタイムアプリケーションのための機械学習ソリューションにおいて、重要で未承認の前提条件は、データアノテーションである。
これはしばしば、退屈で退屈でコストのかかるプロセスである。
データアノテーションを容易にする方法を研究するために,アノテーションガイドラインから自動アノテーションを行うAnnoGuide: Auto-Annotationを新たに導入する。
専門家定義のアノテーションガイドラインから直接データアノテーションの自動メソッドを評価することを目的としており、手動ラベリングの必要性を排除している。
このデータセットは、LiDARポイントクラウドに18のオブジェクトクラスにまたがる3D立方体をラベル付けするための包括的なアノテーションガイドラインを提供する。
これらのガイドラインには、いくつかの視覚的な例やテキストによる記述が含まれているが、LiDARデータにラベル付き3Dキュロイドはない。
強力な基盤モデル(FM)の進歩はAnnoGuideを特にタイムリーにしている。
我々は,(1)RGB画像のオブジェクト検出とセグメンテーションにオープンソースFMを使用し,(2)既知のカメラポーズを用いて2D検出を3Dに投射し,(3)各2D検出のフラストラム内にLiDARポイントをクラスタ化して3Dキューブを生成する,概念的に単純なパイプラインを用いている。
市販のFMを利用する非学習ソリューションから始めて、キーコンポーネントを段階的に洗練し、大幅な性能向上を実現し、3D検出のmAPを12.1から21.9に向上させました!
それにもかかわらず、我々の結果はAnnoGuideが依然としてオープンで困難な問題であり、LiDARベースのFMの開発が急務であることを示している。
コードとモデルをGitHubでリリースします。
関連論文リスト
- ALPI: Auto-Labeller with Proxy Injection for 3D Object Detection using 2D Labels Only [5.699475977818167]
3Dオブジェクト検出は、自動運転車、ロボット工学、拡張現実など、さまざまな応用において重要な役割を果たす。
画像から2次元境界ボックスアノテーションにのみ依存する弱教師付き3次元アノテータを提案する。
論文 参考訳(メタデータ) (2024-07-24T11:58:31Z) - Weakly Supervised 3D Object Detection via Multi-Level Visual Guidance [72.6809373191638]
本稿では,3次元ラベルを必要とせずに2次元ドメインと3次元ドメイン間の制約を活用できるフレームワークを提案する。
具体的には、LiDARと画像特徴をオブジェクト認識領域に基づいて整列する特徴レベルの制約を設計する。
第二に、出力レベルの制約は、2Dと投影された3Dボックスの推定の重なりを強制するために開発される。
第3に、トレーニングレベルの制約は、視覚データと整合した正確で一貫した3D擬似ラベルを生成することによって利用される。
論文 参考訳(メタデータ) (2023-12-12T18:57:25Z) - Weakly Supervised 3D Object Detection with Multi-Stage Generalization [62.96670547848691]
擬似ラベル生成と多段階一般化を含むBA$2$-Detを導入する。
一般化の3つの段階、完全から部分へ、静的から動的へ、そして遠い距離へ進む。
BA$2$-Detは、KITTIデータセットの20%の相対的な改善を達成できる。
論文 参考訳(メタデータ) (2023-06-08T17:58:57Z) - Weakly Supervised Monocular 3D Object Detection using Multi-View
Projection and Direction Consistency [78.76508318592552]
モノクロ3Dオブジェクト検出は、その容易なアプリケーションのための自動駆動において、主流のアプローチとなっている。
現在のほとんどの方法は、トレーニングフェーズで使用される真実をラベル付けするために、まだ3Dポイントのクラウドデータに依存しています。
画像にマークされた2次元ラベルだけでモデルを訓練できる,弱教師付きモノクル3次元オブジェクト検出法を提案する。
論文 参考訳(メタデータ) (2023-03-15T15:14:00Z) - Fiducial Tag Localization on a 3D LiDAR Prior Map [0.6554326244334868]
既存のLiDARフィデューシャルタグローカライズ法は3次元LiDARマップには適用されない。
我々は, 3次元LiDAR事前マップ上で, 画像タグを直接ローカライズする新しい手法を開発した。
我々は,3次元LiDARマップ上のタグのローカライズに適用可能な手法として,定性的かつ定量的な実験を行った。
論文 参考訳(メタデータ) (2022-09-02T14:07:25Z) - Label-Guided Auxiliary Training Improves 3D Object Detector [32.96310946612949]
3次元物体検出(LG3D)のためのラベル誘導補助訓練法を提案する。
提案したLG3Dは,SUN RGB-DおよびScanNetV2データセット上でVoteNetを2.5%,3.1%改善する。
論文 参考訳(メタデータ) (2022-07-24T14:22:21Z) - Unsupervised Object Detection with LiDAR Clues [70.73881791310495]
本稿では,LiDARの手がかりを用いた非教師対象検出のための最初の実用的手法を提案する。
提案手法では,まず3次元点雲に基づく候補オブジェクトセグメントを生成する。
そして、セグメントラベルを割り当て、セグメントラベルネットワークを訓練する反復的なセグメントラベル処理を行う。
ラベル付けプロセスは、長い尾とオープンエンドの分布の問題を軽減するために慎重に設計されている。
論文 参考訳(メタデータ) (2020-11-25T18:59:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。