論文の概要: Learning Object-level Point Augmentor for Semi-supervised 3D Object
Detection
- arxiv url: http://arxiv.org/abs/2212.09273v1
- Date: Mon, 19 Dec 2022 06:56:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-20 17:30:38.100540
- Title: Learning Object-level Point Augmentor for Semi-supervised 3D Object
Detection
- Title(参考訳): 半教師付き3次元物体検出のための物体レベル点拡張器の学習
- Authors: Cheng-Ju Ho, Chen-Hsuan Tai, Yi-Hsuan Tsai, Yen-Yu Lin, Ming-Hsuan
Yang
- Abstract要約: 半教師付き3次元オブジェクト検出のための局所変換を行うオブジェクトレベルポイント拡張器(OPA)を提案する。
このようにして、結果のオーグメンタは、無関係なバックグラウンドではなく、オブジェクトインスタンスを強調するように導出されます。
ScanNetとSUN RGB-Dデータセットの実験は、提案したOPAが最先端の手法に対して好適に動作することを示している。
- 参考スコア(独自算出の注目度): 85.170578641966
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semi-supervised object detection is important for 3D scene understanding
because obtaining large-scale 3D bounding box annotations on point clouds is
time-consuming and labor-intensive. Existing semi-supervised methods usually
employ teacher-student knowledge distillation together with an augmentation
strategy to leverage unlabeled point clouds. However, these methods adopt
global augmentation with scene-level transformations and hence are sub-optimal
for instance-level object detection. In this work, we propose an object-level
point augmentor (OPA) that performs local transformations for semi-supervised
3D object detection. In this way, the resultant augmentor is derived to
emphasize object instances rather than irrelevant backgrounds, making the
augmented data more useful for object detector training. Extensive experiments
on the ScanNet and SUN RGB-D datasets show that the proposed OPA performs
favorably against the state-of-the-art methods under various experimental
settings. The source code will be available at https://github.com/nomiaro/OPA.
- Abstract(参考訳): 半教師付き物体検出は,大規模3次元バウンディングボックスアノテーションの獲得には時間を要するため,3次元シーン理解において重要である。
既存の半教師法では、教師が指導する知識の蒸留と、ラベルなしの点雲を活用するための拡張戦略が用いられる。
しかし、これらの手法はシーンレベルの変換を伴うグローバルな拡張を採用しており、インスタンスレベルのオブジェクト検出にはサブ最適である。
本研究では、半教師付き3次元オブジェクト検出のための局所変換を行うオブジェクトレベルポイント拡張器(OPA)を提案する。
このようにして、augmentant augmentedorは、無関係なバックグラウンドよりもオブジェクトインスタンスを強調するために導出され、拡張されたデータがオブジェクト検出トレーニングにより有用になる。
scannetとsun rgb-dデータセットの広範な実験により、提案されたopaは様々な実験環境で最先端の手法に好適に作用することが示された。
ソースコードはhttps://github.com/nomiaro/opaで入手できる。
関連論文リスト
- Diff3DETR:Agent-based Diffusion Model for Semi-supervised 3D Object Detection [33.58208166717537]
3次元物体検出は3次元シーンの理解に不可欠である。
半教師付き手法の最近の発展は、教師による学習フレームワークを用いて、未ラベルの点群に対する擬似ラベルを生成することにより、この問題を緩和しようとしている。
半教師付き3次元物体検出のためのエージェントベース拡散モデル(Diff3DETR)を提案する。
論文 参考訳(メタデータ) (2024-08-01T05:04:22Z) - What You See Is What You Detect: Towards better Object Densification in
3D detection [2.3436632098950456]
広く使われているフル形状のコンプリートアプローチは、特に遠く離れた物や歩行者のような小さな物に対して、エラーのアップバウンドを高くする。
従来の手法が生成した予測ポイントの11.3%しか必要としない可視部分補完法を提案する。
密表現を復元するために,目に見える前景オブジェクトに関連付けられた点集合を拡大するメッシュデフォーメーションに基づく手法を提案する。
論文 参考訳(メタデータ) (2023-10-27T01:46:37Z) - PatchContrast: Self-Supervised Pre-training for 3D Object Detection [14.603858163158625]
PatchContrastは、3Dオブジェクト検出のための新しい自己教師付きポイントクラウド事前学習フレームワークである。
提案手法は,3つの一般的な3次元検出データセットにおいて,既存の最先端モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-08-14T07:45:54Z) - 3D Video Object Detection with Learnable Object-Centric Global
Optimization [65.68977894460222]
対応性に基づく最適化は3次元シーン再構成の基盤となるが、3次元ビデオオブジェクト検出では研究されていない。
オブジェクト中心の時間対応学習と特徴量付きオブジェクトバンドル調整を備えた、エンドツーエンドで最適化可能なオブジェクト検出器であるBA-Detを提案する。
論文 参考訳(メタデータ) (2023-03-27T17:39:39Z) - Real3D-Aug: Point Cloud Augmentation by Placing Real Objects with
Occlusion Handling for 3D Detection and Segmentation [0.0]
本稿では,すでに注釈付けされているデータを複数回活用するデータ拡張手法を提案する。
本稿では,実データを再利用する拡張フレームワークを提案する。
このパイプラインは、3Dオブジェクトの検出とセマンティックセグメンテーションのためのトップパフォーマンスモデルのトレーニングにおいて、競争力があることを証明している。
論文 参考訳(メタデータ) (2022-06-15T16:25:30Z) - EDN: Salient Object Detection via Extremely-Downsampled Network [66.38046176176017]
画像全体のグローバルビューを効果的に学ぶために、極端なダウンサンプリング技術を使用するExtremely-Downsampled Network(EDN)を紹介します。
実験は、ednがリアルタイム速度でsart性能を達成することを実証する。
論文 参考訳(メタデータ) (2020-12-24T04:23:48Z) - Improving Point Cloud Semantic Segmentation by Learning 3D Object
Detection [102.62963605429508]
ポイントクラウドセマンティックセグメンテーションは、自動運転において重要な役割を果たす。
現在の3Dセマンティックセグメンテーションネットワークは、よく表現されたクラスに対して優れた性能を発揮する畳み込みアーキテクチャに焦点を当てている。
Aware 3D Semantic Detection (DASS) フレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-22T14:17:40Z) - Quantifying Data Augmentation for LiDAR based 3D Object Detection [139.64869289514525]
そこで本研究では,光検出・ランドング(LiDAR)に基づく3次元物体検出において一般的に使用される,様々なデータ拡張手法について光を当てた。
本研究では,グローバルな拡張技術がシーン全体の点雲に適用され,ローカルな拡張技術がシーン内の個々のオブジェクトに属する点にのみ適用される,様々なグローバルおよびローカルな拡張技術について検討する。
以上の結果から,2種類のデータ拡張はパフォーマンス向上につながるが,個々のオブジェクト翻訳などの拡張技術は非生産的であり,全体的なパフォーマンスを損なう可能性があることがわかった。
論文 参考訳(メタデータ) (2020-04-03T16:09:14Z) - SESS: Self-Ensembling Semi-Supervised 3D Object Detection [138.80825169240302]
具体的には、ラベルのない新しい未知のデータに基づくネットワークの一般化を促進するための、徹底的な摂動スキームを設計する。
我々のSESSは、50%のラベル付きデータを用いて、最先端の完全教師付き手法と比較して、競争性能を達成している。
論文 参考訳(メタデータ) (2019-12-26T08:48:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。