論文の概要: Towards Open World Active Learning for 3D Object Detection
- arxiv url: http://arxiv.org/abs/2310.10391v1
- Date: Mon, 16 Oct 2023 13:32:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-17 14:17:46.570352
- Title: Towards Open World Active Learning for 3D Object Detection
- Title(参考訳): 3次元物体検出のためのオープンワールドアクティブラーニングに向けて
- Authors: Zhuoxiao Chen, Yadan Luo, Zixin Wang, Zijian Wang, Xin Yu, Zi Huang
- Abstract要約: 3次元物体検出のためのオープンワールドアクティブラーニング(OWAL-3D)について紹介する。
OWAL-3Dは、既知のクラスと未知クラスの両方で検出性能を最大化しながら、アノテートする少数の3Dボックスを選択することを目的としている。
我々は,2つの関係制約をシンプルかつ効果的なAL戦略であるOpenCRBに統合する。
- 参考スコア(独自算出の注目度): 43.242426340854905
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Significant strides have been made in closed world 3D object detection,
testing systems in environments with known classes. However, the challenge
arises in open world scenarios where new object classes appear. Existing
efforts sequentially learn novel classes from streams of labeled data at a
significant annotation cost, impeding efficient deployment to the wild. To seek
effective solutions, we investigate a more practical yet challenging research
task: Open World Active Learning for 3D Object Detection (OWAL-3D), aiming at
selecting a small number of 3D boxes to annotate while maximizing detection
performance on both known and unknown classes. The core difficulty centers on
striking a balance between mining more unknown instances and minimizing the
labeling expenses of point clouds. Empirically, our study finds the harmonious
and inverse relationship between box quantities and their confidences can help
alleviate the dilemma, avoiding the repeated selection of common known
instances and focusing on uncertain objects that are potentially unknown. We
unify both relational constraints into a simple and effective AL strategy
namely OpenCRB, which guides to acquisition of informative point clouds with
the least amount of boxes to label. Furthermore, we develop a comprehensive
codebase for easy reproducing and future research, supporting 15 baseline
methods (i.e., active learning, out-of-distribution detection and open world
detection), 2 types of modern 3D detectors (i.e., one-stage SECOND and
two-stage PV-RCNN) and 3 benchmark 3D datasets (i.e., KITTI, nuScenes and
Waymo). Extensive experiments evidence that the proposed Open-CRB demonstrates
superiority and flexibility in recognizing both novel and shared categories
with very limited labeling costs, compared to state-of-the-art baselines.
- Abstract(参考訳): クローズドワールドの3dオブジェクト検出、既知のクラスのある環境でのテストで大きな進歩を遂げている。
しかし、この課題は、新しいオブジェクトクラスが現れるオープンワールドのシナリオで起こります。
既存の取り組みはラベル付きデータのストリームから新しいクラスを連続的に大きなアノテーションコストで学習し、効率的なデプロイを妨げる。
実効性のある3Dオブジェクト検出のためのOpen World Active Learning for 3D Object Detection (OWAL-3D) は、未知のクラスと未知のクラスの両方で検出性能を最大化しつつ、アノテートするための少数の3Dボックスを選択することを目的としている。
中心となる課題は、未知のインスタンスのマイニングと、ポイントクラウドのラベル付け費用の最小化のバランスにある。
実験により,ボックス量と信頼度との調和的・逆関係がジレンマの緩和に役立ち,よく知られた事例の繰り返しの選択を回避し,未知の可能性のある不確実な物体に焦点をあてることができた。
我々は、関係制約をopencrbと呼ばれる単純かつ効果的なal戦略に統合し、最小のボックスをラベル付けする情報ポイントクラウドの獲得を導く。
さらに,15のベースライン手法(アクティブラーニング,アウト・オブ・ディストリビューション検出,オープンワールド検出),2種類の現代型3D検出器(一段SECONDと二段PV-RCNN),3つのベンチマーク3Dデータセット(KITTI,nuScenes,Waymo)をサポートする総合的なコードベースを構築した。
大規模な実験により、提案されたOpen-CRBは、最先端のベースラインと比較して、新しいカテゴリーと共有カテゴリの両方を非常に限定的なラベル付けコストで認識する上で、優位性と柔軟性を示すことが証明された。
関連論文リスト
- Training an Open-Vocabulary Monocular 3D Object Detection Model without 3D Data [57.53523870705433]
我々はOVM3D-Detと呼ばれる新しいオープン語彙単分子オブジェクト検出フレームワークを提案する。
OVM3D-Detは、入力または3Dバウンディングボックスを生成するために高精度のLiDARや3Dセンサーデータを必要としない。
オープンボキャブラリ2Dモデルと擬似LiDARを使用して、RGB画像に3Dオブジェクトを自動的にラベル付けし、オープンボキャブラリ単分子3D検出器の学習を促進する。
論文 参考訳(メタデータ) (2024-11-23T21:37:21Z) - Find n' Propagate: Open-Vocabulary 3D Object Detection in Urban Environments [67.83787474506073]
我々は,現在のLiDARに基づく3Dオブジェクト検出システムの限界に対処する。
本稿では,3次元OVタスクに対する汎用textscFind n' Propagate アプローチを提案する。
我々は、新しいオブジェクトクラスに対する平均精度(AP)を最大3.97倍に向上させる。
論文 参考訳(メタデータ) (2024-03-20T12:51:30Z) - Open-Pose 3D Zero-Shot Learning: Benchmark and Challenges [23.663199578392447]
オープンポジション3Dゼロショット分類という,より現実的で困難なシナリオを提案する。
まず,3次元ゼロショット分類に関する現在の研究について再考する。
オープンな設定に特化して設計されたベンチマークデータセットを2つ提案する。
論文 参考訳(メタデータ) (2023-12-12T07:52:33Z) - Exploring Active 3D Object Detection from a Generalization Perspective [58.597942380989245]
不確実性に基づくアクティブな学習ポリシーは、ポイントクラウドの情報性とボックスレベルのアノテーションコストの間のトレードオフのバランスを取れません。
冗長な3次元境界ボックスラベルの点群を階層的にフィルタリングするtextscCrbを提案する。
実験により,提案手法が既存のアクティブラーニング戦略より優れていることが示された。
論文 参考訳(メタデータ) (2023-01-23T02:43:03Z) - Towards Open Set 3D Learning: A Benchmark on Object Point Clouds [17.145309633743747]
本論文は,オープンセット3次元学習に関する第1報である。
カテゴリのセマンティックシフトの観点から,難易度を増すような新しいテストベッドを導入する。
本稿では,最新のアプローチが3Dデータに有効であるかどうか,その理解のために,アウト・オブ・ディストリビューションとオープン・セット2D文献について検討する。
論文 参考訳(メタデータ) (2022-07-23T17:00:45Z) - Exploring Diversity-based Active Learning for 3D Object Detection in Autonomous Driving [45.405303803618]
多様性に基づくアクティブラーニング(AL)を,アノテーションの負担を軽減するための潜在的解決策として検討する。
選択したサンプルの空間的・時間的多様性を強制する新しい取得関数を提案する。
提案手法がnuScenesデータセットに与える影響を実証し,既存のAL戦略を著しく上回ることを示す。
論文 参考訳(メタデータ) (2022-05-16T14:21:30Z) - From Multi-View to Hollow-3D: Hallucinated Hollow-3D R-CNN for 3D Object
Detection [101.20784125067559]
本稿では,3次元物体検出の問題に対処するため,Halucinated Hollow-3D R-CNNという新しいアーキテクチャを提案する。
本稿では,まず,視点ビューと鳥眼ビューに点雲を逐次投影することで,多視点特徴を抽出する。
3Dオブジェクトは、新しい階層型Voxel RoIプール操作でボックスリファインメントモジュールを介して検出される。
論文 参考訳(メタデータ) (2021-07-30T02:00:06Z) - Weakly Supervised 3D Object Detection from Point Clouds [27.70180601788613]
3Dオブジェクト検出は、特定のクラスに属するオブジェクトの3D境界ボックスを検出し、ローカライズすることを目的としている。
既存の3Dオブジェクト検出器は、トレーニング中にアノテーション付き3Dバウンディングボックスに依存している。
基礎となる真理3D境界ボックスを使わずに点雲からの3Dオブジェクト検出を弱教師付きで行うためのフレームワークであるVS3Dを提案する。
論文 参考訳(メタデータ) (2020-07-28T03:30:11Z) - SESS: Self-Ensembling Semi-Supervised 3D Object Detection [138.80825169240302]
具体的には、ラベルのない新しい未知のデータに基づくネットワークの一般化を促進するための、徹底的な摂動スキームを設計する。
我々のSESSは、50%のラベル付きデータを用いて、最先端の完全教師付き手法と比較して、競争性能を達成している。
論文 参考訳(メタデータ) (2019-12-26T08:48:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。