論文の概要: iDet3D: Towards Efficient Interactive Object Detection for LiDAR Point
Clouds
- arxiv url: http://arxiv.org/abs/2312.15449v1
- Date: Sun, 24 Dec 2023 09:59:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-27 18:04:18.828118
- Title: iDet3D: Towards Efficient Interactive Object Detection for LiDAR Point
Clouds
- Title(参考訳): iDet3D:LiDAR点雲の効率的な対話型オブジェクト検出を目指して
- Authors: Dongmin Choi, Wonwoo Cho, Kangyeol Kim, Jaegul Choo
- Abstract要約: 我々は,効率的な対話型3Dオブジェクト検出器iDet3Dを提案する。
iDet3Dはユーザフレンドリーな2Dインターフェースをサポートし、3D空間を探索する際の認知的負担を軽減する。
そこで本手法は,数クリックで正確なアノテーションを構築することができることを示す。
- 参考スコア(独自算出の注目度): 39.261055567560724
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Accurately annotating multiple 3D objects in LiDAR scenes is laborious and
challenging. While a few previous studies have attempted to leverage
semi-automatic methods for cost-effective bounding box annotation, such methods
have limitations in efficiently handling numerous multi-class objects. To
effectively accelerate 3D annotation pipelines, we propose iDet3D, an efficient
interactive 3D object detector. Supporting a user-friendly 2D interface, which
can ease the cognitive burden of exploring 3D space to provide click
interactions, iDet3D enables users to annotate the entire objects in each scene
with minimal interactions. Taking the sparse nature of 3D point clouds into
account, we design a negative click simulation (NCS) to improve accuracy by
reducing false-positive predictions. In addition, iDet3D incorporates two click
propagation techniques to take full advantage of user interactions: (1) dense
click guidance (DCG) for keeping user-provided information throughout the
network and (2) spatial click propagation (SCP) for detecting other instances
of the same class based on the user-specified objects. Through our extensive
experiments, we present that our method can construct precise annotations in a
few clicks, which shows the practicality as an efficient annotation tool for 3D
object detection.
- Abstract(参考訳): LiDARシーンで複数の3Dオブジェクトを正確にアノテートすることは、面倒で難しい。
コスト効率のよいバウンディングボックスアノテーションにセミオートマチック手法を適用しようとする以前の研究はいくつかあったが、そのような手法は多数のマルチクラスオブジェクトを効率的に扱うのに限界がある。
3dアノテーションのパイプラインを効果的に高速化するために,インタラクティブな3dオブジェクト検出ツールidet3dを提案する。
ユーザフレンドリーな2Dインターフェースをサポートし、クリックインタラクションを提供するために3D空間を探索する際の認知的負担を軽減するため、iDet3Dは、各シーンのオブジェクト全体に対して、最小限のインタラクションで注釈を付けることができる。
3次元点雲のスパースな性質を考慮に入れ、偽陽性予測を減らし精度を向上させるために負クリックシミュレーション(NCS)を設計する。
さらに、idet3dでは、ユーザインタラクションを最大限活用するために、2つのクリック伝播技術が組み込まれている。(1)ユーザが提供した情報をネットワーク全体に保持するdcgと、(2)ユーザ特定オブジェクトに基づいて同じクラスの他のインスタンスを検出するspatial click propagation(scp)である。
提案手法は,3dオブジェクト検出のための効率的なアノテーションツールとして実用性を示すため,本手法は数クリックで正確なアノテーションを構築できることを示す。
関連論文リスト
- AGILE3D: Attention Guided Interactive Multi-object 3D Segmentation [32.63772366307106]
我々は,複数の3Dオブジェクトの同時セグメンテーションをサポートする,効率的で注目度の高いモデルAGILE3Dを紹介する。
ユーザクリックを空間的時間的クエリとしてエンコードし、クリッククエリと3Dシーン間の明示的なインタラクションを可能にする。
4つの異なる3Dポイントクラウドデータセットによる実験では、AGILE3Dは新たな最先端技術を設定している。
論文 参考訳(メタデータ) (2023-06-01T17:59:10Z) - CMR3D: Contextualized Multi-Stage Refinement for 3D Object Detection [57.44434974289945]
本稿では,3次元オブジェクト検出(CMR3D)フレームワークのためのコンテキスト型マルチステージリファインメントを提案する。
我々のフレームワークは3Dシーンを入力として取り、シーンの有用なコンテキスト情報を明示的に統合しようと試みている。
3Dオブジェクトの検出に加えて,3Dオブジェクトカウント問題に対するフレームワークの有効性について検討する。
論文 参考訳(メタデータ) (2022-09-13T05:26:09Z) - Interactive Object Segmentation in 3D Point Clouds [27.88495480980352]
本稿では,ユーザが直接3Dポイントクラウドと対話する対話型3Dオブジェクトセグメンテーション手法を提案する。
私たちのモデルは、ターゲットドメインからのトレーニングデータを必要としない。
異なるデータ特性と異なるオブジェクトクラスを持つ他のいくつかのデータセットでうまく機能する。
論文 参考訳(メタデータ) (2022-04-14T18:31:59Z) - Monocular Quasi-Dense 3D Object Tracking [99.51683944057191]
周囲の物体の将来の位置を予測し、自律運転などの多くのアプリケーションで観測者の行動を計画するためには、信頼性と正確な3D追跡フレームワークが不可欠である。
移動プラットフォーム上で撮影された2次元画像のシーケンスから,移動物体を時間とともに効果的に関連付け,その全3次元バウンディングボックス情報を推定するフレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-12T15:30:02Z) - PLUME: Efficient 3D Object Detection from Stereo Images [95.31278688164646]
既存の手法では、2つのステップでこの問題に対処する: 第一深度推定を行い、その深さ推定から擬似LiDAR点雲表現を計算し、3次元空間で物体検出を行う。
この2つのタスクを同一のメトリック空間で統一するモデルを提案する。
提案手法は,既存の手法と比較して推定時間を大幅に削減し,挑戦的なKITTIベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2021-01-17T05:11:38Z) - Relation3DMOT: Exploiting Deep Affinity for 3D Multi-Object Tracking
from View Aggregation [8.854112907350624]
3Dマルチオブジェクトトラッキングは、自律ナビゲーションにおいて重要な役割を果たす。
多くのアプローチでは、トラッキングのための2次元RGBシーケンス内のオブジェクトを検出するが、これは3次元空間内のオブジェクトをローカライズする際の信頼性の欠如である。
本稿では,隣接フレーム内の各オブジェクト間の相関をよりよく活用するために,RelationConvという新しい畳み込み演算を提案する。
論文 参考訳(メタデータ) (2020-11-25T16:14:40Z) - D3Feat: Joint Learning of Dense Detection and Description of 3D Local
Features [51.04841465193678]
私たちは3Dポイントクラウドに3D完全畳み込みネットワークを活用しています。
本稿では,3次元点ごとに検出スコアと記述特徴の両方を密に予測する,新しい,実践的な学習機構を提案する。
本手法は,屋内と屋外の両方のシナリオで最先端の手法を実現する。
論文 参考訳(メタデータ) (2020-03-06T12:51:09Z) - SESS: Self-Ensembling Semi-Supervised 3D Object Detection [138.80825169240302]
具体的には、ラベルのない新しい未知のデータに基づくネットワークの一般化を促進するための、徹底的な摂動スキームを設計する。
我々のSESSは、50%のラベル付きデータを用いて、最先端の完全教師付き手法と比較して、競争性能を達成している。
論文 参考訳(メタデータ) (2019-12-26T08:48:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。