論文の概要: Class-Distribution Guided Active Learning for 3D Occupancy Prediction in Autonomous Driving
- arxiv url: http://arxiv.org/abs/2603.27294v1
- Date: Sat, 28 Mar 2026 14:56:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:44.883341
- Title: Class-Distribution Guided Active Learning for 3D Occupancy Prediction in Autonomous Driving
- Title(参考訳): 自律運転における3次元作業予測のためのクラス分散指導型アクティブラーニング
- Authors: Wonjune Kim, In-Jae Lee, Sihwan Hwang, Sanmin Kim, Dongsuk Kum,
- Abstract要約: 本稿では,自律運転データセットにアノテートするトレーニングサンプルを選択するための,クラス配布指導型アクティブラーニングフレームワークを提案する。
我々のフレームワークは26.62 mIoUに達し、同じ予算で完全な監視と優れたアクティブラーニングベースラインに匹敵する。
- 参考スコア(独自算出の注目度): 18.74482609280131
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: 3D occupancy prediction provides dense spatial understanding critical for safe autonomous driving. However, this task suffers from a severe class imbalance due to its volumetric representation, where safety-critical objects (bicycles, traffic cones, pedestrians) occupy minimal voxels compared to dominant backgrounds. Additionally, voxel-level annotation is costly, yet dedicating effort to dominant classes is inefficient. To address these challenges, we propose a class-distribution guided active learning framework for selecting training samples to annotate in autonomous driving datasets. Our approach combines three complementary criteria to select the training samples. Inter-sample diversity prioritizes samples whose predicted class distributions differ from those of the labeled set, intra-set diversity prevents redundant sampling within each acquisition cycle, and frequency-weighted uncertainty emphasizes rare classes by reweighting voxel-level entropy with inverse per-sample class proportions. We ensure evaluation validity by using a geographically disjoint train/validation split of Occ3D-nuScenes, which reduces train-validation overlap and mitigates potential map memorization. With only 42.4% labeled data, our framework reaches 26.62 mIoU, comparable to full supervision and outperforming active learning baselines at the same budget. We further validate generality on SemanticKITTI using a different architecture, demonstrating consistent effectiveness across datasets.
- Abstract(参考訳): 3次元占有予測は、安全な自律運転に不可欠な密集した空間理解を提供する。
しかし、この作業は、安全クリティカルな物体(自転車、交通コーン、歩行者)が支配的な背景に比べて最小限のボクセルを占有する、容積表現による厳しい階級不均衡に悩まされている。
さらに、voxelレベルのアノテーションはコストがかかるが、支配的なクラスに努力を捧げることは非効率である。
これらの課題に対処するために,自律運転データセットに注釈をつけるためのトレーニングサンプルを選択するための,クラス分散型アクティブラーニングフレームワークを提案する。
提案手法は3つの相補的基準を組み合わせてトレーニングサンプルを選択する。
サンプル間の多様性は、予測されたクラス分布がラベル付きセットと異なるサンプルを優先し、セット内多様性は、取得サイクル毎に冗長なサンプリングを防止し、周波数重み付き不確実性は、サンプルごとのクラス比の逆でボクセルレベルのエントロピーを再重み付けすることで、レアクラスを強調する。
我々は、Occ3D-nuScenesの地理的に不随意な列車/無効化分割を用いて、列車の重複を低減し、潜在的な地図の記憶を軽減し、評価の妥当性を確保する。
42.4%のラベル付きデータしか持たず、我々のフレームワークは26.62 mIoUに達している。
さらに、異なるアーキテクチャを用いてSemanticKITTIの汎用性を検証し、データセット間で一貫した有効性を示す。
関連論文リスト
- Rethinking Representativeness and Diversity in Dynamic Data Selection [32.400383488290906]
動的データ選択は、精度を維持しながらデータセットの変動するサブセットをサンプリングすることで、トレーニングを加速する。
サンプル評価の基礎となる2つの基本概念、代表性と多様性を再考する。
本手法は2倍以上のトレーニングアクセラレーションと完全データ精度を一致または超える。
論文 参考訳(メタデータ) (2026-03-05T09:21:58Z) - TSceneJAL: Joint Active Learning of Traffic Scenes for 3D Object Detection [26.059907173437114]
TSceneJALフレームワークはラベル付きデータとラベルなしデータの両方から、バランスのとれた、多様性のある、複雑なトラフィックシーンを効率的にサンプリングすることができる。
提案手法は,3次元オブジェクト検出タスクにおける既存の最先端手法よりも12%向上した。
論文 参考訳(メタデータ) (2024-12-25T11:07:04Z) - Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。
我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文 参考訳(メタデータ) (2023-12-27T09:03:43Z) - Revisiting Domain-Adaptive 3D Object Detection by Reliable, Diverse and
Class-balanced Pseudo-Labeling [38.07637524378327]
ドメイン適応型3Dオブジェクト検出において,疑似ラベリング技術を用いた教師なしドメイン適応(DA)が重要なアプローチとして浮上している。
既存のDAメソッドは、マルチクラスのトレーニング環境に適用した場合、パフォーマンスが大幅に低下する。
本稿では,すべてのクラスを一度に検出する学習に適した新しいReDBフレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-16T04:34:11Z) - Open-Set Semi-Supervised Learning for 3D Point Cloud Understanding [62.17020485045456]
半教師付き学習(SSL)では、ラベル付きデータと同じ分布からラベル付きデータが引き出されることが一般的である。
サンプル重み付けによりラベルなしデータを選択的に活用することを提案する。
論文 参考訳(メタデータ) (2022-05-02T16:09:17Z) - Leveraging Ensembles and Self-Supervised Learning for Fully-Unsupervised
Person Re-Identification and Text Authorship Attribution [77.85461690214551]
完全ラベル付きデータからの学習は、Person Re-IdentificationやText Authorship Attributionなどのマルチメディアフォレスト問題において困難である。
近年の自己教師型学習法は,基礎となるクラスに意味的差異が有る場合に,完全ラベル付きデータを扱う際に有効であることが示されている。
本研究では,異なるクラスからのサンプルが顕著に多様性を持っていない場合でも,ラベルのないデータから学習できるようにすることにより,個人再認識とテキストオーサシップの属性に対処する戦略を提案する。
論文 参考訳(メタデータ) (2022-02-07T13:08:11Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - Guided Point Contrastive Learning for Semi-supervised Point Cloud
Semantic Segmentation [90.2445084743881]
そこで本研究では,モデル性能を向上させるために,未ラベルの点群をトレーニングに採用するための半教師付き点群セマンティックセマンティックセマンティックセマンティクスを提案する。
近年の自己監督型タスクのコントラスト損失に触発されて,特徴表現とモデル一般化能力を高めるためのガイド付きポイントコントラスト損失を提案する。
論文 参考訳(メタデータ) (2021-10-15T16:38:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。