論文の概要: MonoSAOD: Monocular 3D Object Detection with Sparsely Annotated Label
- arxiv url: http://arxiv.org/abs/2604.01646v1
- Date: Thu, 02 Apr 2026 05:43:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.458669
- Title: MonoSAOD: Monocular 3D Object Detection with Sparsely Annotated Label
- Title(参考訳): MonoSAOD: わずかに注釈付きラベルによる単眼3次元物体検出
- Authors: Junyoung Jung, Seokwon Kim, Jun Uk Kim,
- Abstract要約: 本稿では,2つのキーモジュールを用いた特異な注釈付きモノクロ3Dオブジェクト検出のための新しいフレームワークを提案する。
RAPAは3次元の幾何的一貫性を維持しながら、分割されたオブジェクトパッチを道路領域に拡張する。
PBFはプロトタイプの類似性と深さの不確実性によって予測をフィルタリングすることで高品質な擬似ラベルを生成する。
トレーニング戦略は,幾何保存強化とプロトタイプ誘導擬似ラベルを組み合わせることで,疎度監視下で頑健な検出を実現する。
- 参考スコア(独自算出の注目度): 0.11470070927586014
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Monocular 3D object detection has achieved impressive performance on densely annotated datasets. However, it struggles when only a fraction of objects are labeled due to the high cost of 3D annotation. This sparsely annotated setting is common in real-world scenarios where annotating every object is impractical. To address this, we propose a novel framework for sparsely annotated monocular 3D object detection with two key modules. First, we propose Road-Aware Patch Augmentation (RAPA), which leverages sparse annotations by augmenting segmented object patches onto road regions while preserving 3D geometric consistency. Second, we propose Prototype-Based Filtering (PBF), which generates high-quality pseudo-labels by filtering predictions through prototype similarity and depth uncertainty. It maintains global 2D RoI feature prototypes and selects pseudo-labels that are both feature-consistent with learned prototypes and have reliable depth estimates. Our training strategy combines geometry-preserving augmentation with prototype-guided pseudo-labeling to achieve robust detection under sparse supervision. Extensive experiments demonstrate the effectiveness of the proposed method. The source code is available at https://github.com/VisualAIKHU/MonoSAOD .
- Abstract(参考訳): モノクロ3Dオブジェクト検出は、高密度の注釈付きデータセットで印象的なパフォーマンスを達成した。
しかし、3Dアノテーションのコストが高いため、少数のオブジェクトだけがラベル付けされるのに苦労する。
このわずかに注釈付けされた設定は、すべてのオブジェクトに注釈を付けるのが現実のシナリオで一般的である。
そこで本研究では,2つのキーモジュールを用いた特異な単分子3次元物体検出のための新しいフレームワークを提案する。
まず,3次元の幾何的整合性を維持しつつ,分割されたオブジェクトパッチを道路領域に拡大することにより,スパースアノテーションを活用する道路対応パッチ拡張(RAPA)を提案する。
第2に,プロトタイプ類似性と深度不確実性による予測をフィルタリングすることにより,高品質な擬似ラベルを生成するプロトタイプベースフィルタ(PBF)を提案する。
グローバルな2D RoI機能プロトタイプを維持し、学習されたプロトタイプと互換性があり、信頼性の高い深さ推定値を持つ擬似ラベルを選択する。
トレーニング戦略は,幾何保存強化とプロトタイプ誘導擬似ラベルを組み合わせることで,疎度監視下で頑健な検出を実現する。
大規模実験により提案手法の有効性が示された。
ソースコードはhttps://github.com/VisualAIKHU/MonoSAODで入手できる。
関連論文リスト
- Unified Unsupervised and Sparsely-Supervised 3D Object Detection by Semantic Pseudo-Labeling and Prototype Learning [0.0]
3Dオブジェクト検出は、自律走行とロボット知覚に不可欠である。
アノテーション依存を減らすために、教師なしおよび疎監督のパラダイムが出現した。
本稿では、教師なしとスパースアップされた3Dオブジェクト検出のための統一的なトレーニングフレームワークであるSPLを提案する。
論文 参考訳(メタデータ) (2026-02-25T01:26:34Z) - PatchContrast: Self-Supervised Pre-training for 3D Object Detection [14.493213289990962]
PatchContrastは、3Dオブジェクト検出のための新しい自己教師付きポイントクラウド事前学習フレームワークである。
提案手法は,3つの一般的な3次元検出データセットにおいて,既存の最先端モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-08-14T07:45:54Z) - Weakly Supervised Monocular 3D Object Detection using Multi-View
Projection and Direction Consistency [78.76508318592552]
モノクロ3Dオブジェクト検出は、その容易なアプリケーションのための自動駆動において、主流のアプローチとなっている。
現在のほとんどの方法は、トレーニングフェーズで使用される真実をラベル付けするために、まだ3Dポイントのクラウドデータに依存しています。
画像にマークされた2次元ラベルだけでモデルを訓練できる,弱教師付きモノクル3次元オブジェクト検出法を提案する。
論文 参考訳(メタデータ) (2023-03-15T15:14:00Z) - CAGroup3D: Class-Aware Grouping for 3D Object Detection on Point Clouds [55.44204039410225]
本稿では,CAGroup3Dという新しい2段階完全スパース3Dオブジェクト検出フレームワークを提案する。
提案手法は,まず,オブジェクト表面のボクセル上でのクラス認識型局所群戦略を活用することによって,高品質な3D提案を生成する。
不正なボクセルワイドセグメンテーションにより欠落したボクセルの特徴を回復するために,完全にスパースな畳み込み型RoIプールモジュールを構築した。
論文 参考訳(メタデータ) (2022-10-09T13:38:48Z) - Progressive Coordinate Transforms for Monocular 3D Object Detection [52.00071336733109]
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
論文 参考訳(メタデータ) (2021-08-12T15:22:33Z) - Anchor-free 3D Single Stage Detector with Mask-Guided Attention for
Point Cloud [79.39041453836793]
我々は、点雲をアンカーフリーで検出する新しい1段3次元検出器を開発した。
ボクセルをベースとしたスパース3D特徴量からスパース2D特徴量マップに変換することでこれを克服する。
検出信頼度スコアとバウンディングボックス回帰の精度との相関性を改善するために,IoUに基づく検出信頼度再校正手法を提案する。
論文 参考訳(メタデータ) (2021-08-08T13:42:13Z) - SESS: Self-Ensembling Semi-Supervised 3D Object Detection [138.80825169240302]
具体的には、ラベルのない新しい未知のデータに基づくネットワークの一般化を促進するための、徹底的な摂動スキームを設計する。
我々のSESSは、50%のラベル付きデータを用いて、最先端の完全教師付き手法と比較して、競争性能を達成している。
論文 参考訳(メタデータ) (2019-12-26T08:48:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。