論文の概要: Uncertainty Meets Diversity: A Comprehensive Active Learning Framework for Indoor 3D Object Detection
- arxiv url: http://arxiv.org/abs/2503.16125v1
- Date: Thu, 20 Mar 2025 13:12:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-21 16:33:47.712970
- Title: Uncertainty Meets Diversity: A Comprehensive Active Learning Framework for Indoor 3D Object Detection
- Title(参考訳): 不確実性と多様性 - 屋内3Dオブジェクト検出のための総合的アクティブラーニングフレームワーク
- Authors: Jiangyi Wang, Na Zhao,
- Abstract要約: 本稿では,室内3次元物体検出のためのアクティブラーニングに関する最初の研究を行い,本課題に適した新しい枠組みを提案する。
提案手法は,不確実性と多様性という2つの重要な基準を取り入れて,アノテーションのための最も曖昧で情報に富んだサンプルを積極的に選択する。
我々は,SUN RGB-D と ScanNetV2 の手法を評価したところ,基準値が大幅に向上し,アノテーション予算の 10% に留まらず,全監督性能の 85% 以上を達成できた。
- 参考スコア(独自算出の注目度): 2.1062220557947957
- License:
- Abstract: Active learning has emerged as a promising approach to reduce the substantial annotation burden in 3D object detection tasks, spurring several initiatives in outdoor environments. However, its application in indoor environments remains unexplored. Compared to outdoor 3D datasets, indoor datasets face significant challenges, including fewer training samples per class, a greater number of classes, more severe class imbalance, and more diverse scene types and intra-class variances. This paper presents the first study on active learning for indoor 3D object detection, where we propose a novel framework tailored for this task. Our method incorporates two key criteria - uncertainty and diversity - to actively select the most ambiguous and informative unlabeled samples for annotation. The uncertainty criterion accounts for both inaccurate detections and undetected objects, ensuring that the most ambiguous samples are prioritized. Meanwhile, the diversity criterion is formulated as a joint optimization problem that maximizes the diversity of both object class distributions and scene types, using a new Class-aware Adaptive Prototype (CAP) bank. The CAP bank dynamically allocates representative prototypes to each class, helping to capture varying intra-class diversity across different categories. We evaluate our method on SUN RGB-D and ScanNetV2, where it outperforms baselines by a significant margin, achieving over 85% of fully-supervised performance with just 10% of the annotation budget.
- Abstract(参考訳): アクティブラーニングは、3Dオブジェクト検出タスクにおける実質的なアノテーション負担を軽減するための有望なアプローチとして現れ、屋外環境におけるいくつかのイニシアチブを刺激している。
しかし、室内環境への応用は未調査のままである。
屋外の3Dデータセットと比較して、屋内データセットは、クラス毎のトレーニングサンプルの少なさ、より多くのクラス、より厳しいクラスの不均衡、より多様なシーンタイプとクラス内のばらつきなど、重大な課題に直面している。
本稿では,室内3次元物体検出のためのアクティブラーニングに関する最初の研究を行い,本課題に適した新しい枠組みを提案する。
提案手法は,不確実性と多様性という2つの重要な基準を取り入れ,アノテーションに対する最も曖昧で情報に富む未表示サンプルを積極的に選択する。
不確実性基準は、不正確な検出と未検出物体の両方を考慮し、最も曖昧なサンプルが優先される。
一方、多様性基準は、新しいクラス対応適応プロトタイプ(CAP)バンクを用いて、オブジェクトクラス分布とシーンタイプの両方の多様性を最大化する共同最適化問題として定式化される。
CAPバンクは、各クラスに代表プロトタイプを動的に割り当て、さまざまなカテゴリのクラス内多様性をキャプチャするのに役立つ。
我々は,SUN RGB-D と ScanNetV2 の手法を評価したところ,基準値が大幅に向上し,アノテーション予算の 10% に留まらず,全監督性能の 85% 以上を達成できた。
関連論文リスト
- TSceneJAL: Joint Active Learning of Traffic Scenes for 3D Object Detection [26.059907173437114]
TSceneJALフレームワークはラベル付きデータとラベルなしデータの両方から、バランスのとれた、多様性のある、複雑なトラフィックシーンを効率的にサンプリングすることができる。
提案手法は,3次元オブジェクト検出タスクにおける既存の最先端手法よりも12%向上した。
論文 参考訳(メタデータ) (2024-12-25T11:07:04Z) - Oriented Tiny Object Detection: A Dataset, Benchmark, and Dynamic Unbiased Learning [51.170479006249195]
本研究では,新しいデータセット,ベンチマーク,動的粗大な学習手法を提案する。
提案するデータセットであるAI-TOD-Rは、すべてのオブジェクト指向オブジェクト検出データセットの中で最小のオブジェクトサイズを特徴としている。
完全教師付きおよびラベル効率の両アプローチを含む,幅広い検出パラダイムにまたがるベンチマークを提案する。
論文 参考訳(メタデータ) (2024-12-16T09:14:32Z) - Exploiting Unlabeled Data with Multiple Expert Teachers for Open Vocabulary Aerial Object Detection and Its Orientation Adaptation [58.37525311718006]
OVAD(Open-vocabulary Aero Object Detection)という,航空物体検出問題の新しい定式化を行った。
本稿では,CLIP-activated students-Teacher DetectionフレームワークであるCastDetを提案する。
本フレームワークは,ロバストなローカライズ教師といくつかのボックス選択戦略を統合し,新しいオブジェクトの高品質な提案を生成する。
論文 参考訳(メタデータ) (2024-11-04T12:59:13Z) - Find n' Propagate: Open-Vocabulary 3D Object Detection in Urban Environments [67.83787474506073]
我々は,現在のLiDARに基づく3Dオブジェクト検出システムの限界に対処する。
本稿では,3次元OVタスクに対する汎用textscFind n' Propagate アプローチを提案する。
我々は、新しいオブジェクトクラスに対する平均精度(AP)を最大3.97倍に向上させる。
論文 参考訳(メタデータ) (2024-03-20T12:51:30Z) - Dual-Perspective Knowledge Enrichment for Semi-Supervised 3D Object
Detection [55.210991151015534]
本稿では, DPKE という新しい2次元知識豊か化手法を提案する。
我々のDPKEは、データパースペクティブと機能パースペクティブという2つの観点から、限られたトレーニングデータ、特にラベルなしデータの知識を豊かにしています。
論文 参考訳(メタデータ) (2024-01-10T08:56:07Z) - Revisiting Domain-Adaptive 3D Object Detection by Reliable, Diverse and
Class-balanced Pseudo-Labeling [38.07637524378327]
ドメイン適応型3Dオブジェクト検出において,疑似ラベリング技術を用いた教師なしドメイン適応(DA)が重要なアプローチとして浮上している。
既存のDAメソッドは、マルチクラスのトレーニング環境に適用した場合、パフォーマンスが大幅に低下する。
本稿では,すべてのクラスを一度に検出する学習に適した新しいReDBフレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-16T04:34:11Z) - Exploring Active 3D Object Detection from a Generalization Perspective [58.597942380989245]
不確実性に基づくアクティブな学習ポリシーは、ポイントクラウドの情報性とボックスレベルのアノテーションコストの間のトレードオフのバランスを取れません。
冗長な3次元境界ボックスラベルの点群を階層的にフィルタリングするtextscCrbを提案する。
実験により,提案手法が既存のアクティブラーニング戦略より優れていることが示された。
論文 参考訳(メタデータ) (2023-01-23T02:43:03Z) - Open-Set Semi-Supervised Learning for 3D Point Cloud Understanding [62.17020485045456]
半教師付き学習(SSL)では、ラベル付きデータと同じ分布からラベル付きデータが引き出されることが一般的である。
サンプル重み付けによりラベルなしデータを選択的に活用することを提案する。
論文 参考訳(メタデータ) (2022-05-02T16:09:17Z) - Entropy-based Active Learning for Object Detection with Progressive
Diversity Constraint [31.094612936162754]
アクティブラーニングは、コンピュータビジョンタスクにおける高アノテーションコストの問題を軽減するための有望な代替手段である。
本稿では,この問題に対処する新たなハイブリッドアプローチを提案し,ボトムアップ方式でインスタンスレベルの不確実性と多様性を共同で検討する。
論文 参考訳(メタデータ) (2022-04-17T09:51:12Z) - Learning a Discriminant Latent Space with Neural Discriminant Analysis [7.074386822875744]
我々は、ディープ畳み込みニューラルネットワーク(DCNN)のためのニューラル識別分析(NDA)と呼ばれる最適化を提案する。
NDAは、深い特徴をより差別的になるように変換し、様々なタスクのパフォーマンスを改善する。
我々は、NDA最適化を、一般的な教師付き分類、きめ細かい分類、半教師付き学習、分布検出など、さまざまな研究分野において評価する。
論文 参考訳(メタデータ) (2021-07-13T16:06:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。