論文の概要: View-to-Label: Multi-View Consistency for Self-Supervised 3D Object
Detection
- arxiv url: http://arxiv.org/abs/2305.17972v1
- Date: Mon, 29 May 2023 09:30:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-30 15:39:45.982823
- Title: View-to-Label: Multi-View Consistency for Self-Supervised 3D Object
Detection
- Title(参考訳): View-to-Label: 自己監督型3Dオブジェクト検出のためのマルチビュー一貫性
- Authors: Issa Mouawad, Nikolas Brasch, Fabian Manhardt, Federico Tombari,
Francesca Odone
- Abstract要約: 本稿では,RGBシーケンスのみから,自己監督型3Dオブジェクト検出を行う手法を提案する。
KITTI 3Dデータセットを用いた実験では,最先端の自己管理手法と同等の性能を示した。
- 参考スコア(独自算出の注目度): 46.077668660248534
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For autonomous vehicles, driving safely is highly dependent on the capability
to correctly perceive the environment in 3D space, hence the task of 3D object
detection represents a fundamental aspect of perception. While 3D sensors
deliver accurate metric perception, monocular approaches enjoy cost and
availability advantages that are valuable in a wide range of applications.
Unfortunately, training monocular methods requires a vast amount of annotated
data. Interestingly, self-supervised approaches have recently been successfully
applied to ease the training process and unlock access to widely available
unlabelled data. While related research leverages different priors including
LIDAR scans and stereo images, such priors again limit usability. Therefore, in
this work, we propose a novel approach to self-supervise 3D object detection
purely from RGB sequences alone, leveraging multi-view constraints and weak
labels. Our experiments on KITTI 3D dataset demonstrate performance on par with
state-of-the-art self-supervised methods using LIDAR scans or stereo images.
- Abstract(参考訳): 自動運転車では、安全運転は3次元空間の環境を正しく知覚する能力に大きく依存しているため、3次元物体検出のタスクは認識の基本的な側面である。
3dセンサーは正確なメトリック知覚を提供するが、単眼的アプローチは、幅広いアプリケーションで価値のあるコストと可用性の利点を享受する。
残念ながら、単項法のトレーニングには膨大な量の注釈データが必要です。
興味深いことに、自制的なアプローチが最近、トレーニングプロセスの容易化と、広く利用可能な未使用データへのアクセスのアンロックに成功している。
関連する研究は、LIDARスキャンやステレオ画像など、さまざまな先行技術を活用しているが、そのような先行技術は再びユーザビリティを制限している。
そこで本研究では,RGBシーケンスのみから,多視点制約と弱いラベルを生かした,自己監督型3Dオブジェクト検出手法を提案する。
LIDARスキャンやステレオ画像を用いた最先端の自己監督手法と同等の性能を示すKITTI 3Dデータセットの実験を行った。
関連論文リスト
- LISO: Lidar-only Self-Supervised 3D Object Detection [25.420879730860936]
本稿では,SOTAライダーオブジェクト検出ネットワークを学習するための新しい自己教師手法を提案する。
これはライダー点雲のラベルなし列にのみ作用する。
ボンネット下のSOTA自監督ライダーシーンフローネットワークを利用して、疑似地上真実を生成し、追跡し、反復的に洗練する。
論文 参考訳(メタデータ) (2024-03-11T18:02:52Z) - SOGDet: Semantic-Occupancy Guided Multi-view 3D Object Detection [19.75965521357068]
本稿では,SOGDet(Semantic-Occupancy Guided Multi-view Object Detection)と呼ばれる新しい手法を提案する。
以上の結果から,SOGDet は nuScenes Detection Score (NDS) と平均平均精度 (mAP) の3つのベースライン法の性能を一貫して向上させることがわかった。
これは、3Dオブジェクト検出と3Dセマンティック占有の組み合わせが、3D環境をより包括的に認識し、より堅牢な自律運転システムの構築を支援することを示唆している。
論文 参考訳(メタデータ) (2023-08-26T07:38:21Z) - Weakly Supervised Monocular 3D Object Detection using Multi-View
Projection and Direction Consistency [78.76508318592552]
モノクロ3Dオブジェクト検出は、その容易なアプリケーションのための自動駆動において、主流のアプローチとなっている。
現在のほとんどの方法は、トレーニングフェーズで使用される真実をラベル付けするために、まだ3Dポイントのクラウドデータに依存しています。
画像にマークされた2次元ラベルだけでモデルを訓練できる,弱教師付きモノクル3次元オブジェクト検出法を提案する。
論文 参考訳(メタデータ) (2023-03-15T15:14:00Z) - Generalized Few-Shot 3D Object Detection of LiDAR Point Cloud for
Autonomous Driving [91.39625612027386]
我々は,一般的な(ベース)オブジェクトに対して大量のトレーニングデータを持つが,レア(ノーベル)クラスに対してはごく少数のデータしか持たない,一般化された数発の3Dオブジェクト検出という新しいタスクを提案する。
具体的には、画像と点雲の奥行きの違いを分析し、3D LiDARデータセットにおける少数ショット設定の実践的原理を示す。
この課題を解決するために,既存の3次元検出モデルを拡張し,一般的なオブジェクトと稀なオブジェクトの両方を認識するためのインクリメンタルな微調整手法を提案する。
論文 参考訳(メタデータ) (2023-02-08T07:11:36Z) - TripletTrack: 3D Object Tracking using Triplet Embeddings and LSTM [0.0]
3Dオブジェクトトラッキングは、自動運転システムにおいて重要なタスクである。
本稿では,3次元物体追跡における3重項埋め込みと動作表現の併用について検討する。
論文 参考訳(メタデータ) (2022-10-28T15:23:50Z) - An Empirical Study of Pseudo-Labeling for Image-based 3D Object
Detection [72.30883544352918]
異なる条件下で,擬似ラベルがベースラインモデルに対して効果的に監視できるかどうかを検討する。
ベルとホイッスルを使わずにKITTI-3Dテストセットの適度なレベルを20.23 APで達成し、ベースラインモデルを6.03 APで改善した。
この研究が、半教師付き環境下で画像に基づく3D検出コミュニティに洞察を与えてくれることを願っている。
論文 参考訳(メタデータ) (2022-08-15T12:17:46Z) - Learnable Online Graph Representations for 3D Multi-Object Tracking [156.58876381318402]
3D MOT問題に対する統一型学習型アプローチを提案します。
我々は、完全にトレーニング可能なデータアソシエーションにNeural Message Passing Networkを使用します。
AMOTAの65.6%の最先端性能と58%のIDスウィッチを達成して、公開可能なnuScenesデータセットに対する提案手法のメリットを示す。
論文 参考訳(メタデータ) (2021-04-23T17:59:28Z) - SESS: Self-Ensembling Semi-Supervised 3D Object Detection [138.80825169240302]
具体的には、ラベルのない新しい未知のデータに基づくネットワークの一般化を促進するための、徹底的な摂動スキームを設計する。
我々のSESSは、50%のラベル付きデータを用いて、最先端の完全教師付き手法と比較して、競争性能を達成している。
論文 参考訳(メタデータ) (2019-12-26T08:48:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。