論文の概要: Self-Supervised Person Detection in 2D Range Data using a Calibrated
Camera
- arxiv url: http://arxiv.org/abs/2012.08890v1
- Date: Wed, 16 Dec 2020 12:10:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-03 02:50:39.784431
- Title: Self-Supervised Person Detection in 2D Range Data using a Calibrated
Camera
- Title(参考訳): キャリブレーションカメラを用いた2次元距離データの自己監視人検出
- Authors: Dan Jia and Mats Steinweg and Alexander Hermans and Bastian Leibe
- Abstract要約: 2次元LiDARに基づく人検出器のトレーニングラベル(擬似ラベル)を自動生成する手法を提案する。
擬似ラベルで訓練または微調整された自己監視検出器が,手動アノテーションを用いて訓練された検出器を上回っていることを示した。
私達の方法は付加的な分類の努力なしで配置の間に人の探知器を改善する有効な方法です。
- 参考スコア(独自算出の注目度): 83.31666463259849
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning is the essential building block of state-of-the-art person
detectors in 2D range data. However, only a few annotated datasets are
available for training and testing these deep networks, potentially limiting
their performance when deployed in new environments or with different LiDAR
models. We propose a method, which uses bounding boxes from an image-based
detector (e.g. Faster R-CNN) on a calibrated camera to automatically generate
training labels (called pseudo-labels) for 2D LiDAR-based person detectors.
Through experiments on the JackRabbot dataset with two detector models, DROW3
and DR-SPAAM, we show that self-supervised detectors, trained or fine-tuned
with pseudo-labels, outperform detectors trained using manual annotations from
a different dataset. Combined with robust training techniques, the
self-supervised detectors reach a performance close to the ones trained using
manual annotations. Our method is an effective way to improve person detectors
during deployment without any additional labeling effort, and we release our
source code to support relevant robotic applications.
- Abstract(参考訳): ディープラーニングは、2dレンジデータにおける最先端の人物検出器の重要な構築ブロックである。
しかし、これらのディープネットワークのトレーニングとテストのために利用可能なデータセットはわずかであり、新しい環境や異なるLiDARモデルにデプロイする際のパフォーマンスを制限する可能性がある。
画像ベース検出器(例)からのバウンディングボックスを利用する手法を提案する。
キャリブレーションカメラ上のより高速なR-CNNは、2D LiDARベースの人検知器のためのトレーニングラベル(擬似ラベルと呼ばれる)を自動的に生成する。
DROW3とDR-SPAAMの2つの検出器モデルを用いたJackRabbotデータセットの実験を通して、擬似ラベルで訓練された、または微調整された自己教師型検出器が、異なるデータセットから手動アノテーションを用いて訓練された優れた検出器であることを示す。
堅牢なトレーニング技術と組み合わせて、自己監視型検出器は手動のアノテーションを使って訓練されたものに近いパフォーマンスを達成する。
本手法は,追加のラベル付けを行わずに展開中の人体検知器を改良する有効な方法であり,関連するロボットアプリケーションをサポートするためにソースコードをリリースする。
関連論文リスト
- VaLID: Verification as Late Integration of Detections for LiDAR-Camera Fusion [2.503388496100123]
LiDARの使用法は一般的にカメラのみを使用する方法よりも優れている。
本稿では,各予測境界ボックスが許容可能であるかどうかを検証したモデル独立遅延融合法VaLIDを提案する。
提案手法はモデル非依存であり,汎用カメラ検出器を用いた場合においても,最先端の競争性能を示す。
論文 参考訳(メタデータ) (2024-09-23T20:27:10Z) - TrajSSL: Trajectory-Enhanced Semi-Supervised 3D Object Detection [59.498894868956306]
Pseudo-labeling approach to semi-supervised learning は教師-学生の枠組みを採用する。
我々は、事前学習した動き予測モデルを活用し、擬似ラベル付きデータに基づいて物体軌跡を生成する。
提案手法は2つの異なる方法で擬似ラベル品質を向上する。
論文 参考訳(メタデータ) (2024-09-17T05:35:00Z) - Vision-Language Guidance for LiDAR-based Unsupervised 3D Object Detection [16.09503890891102]
我々は,LiDAR点雲のみで動作する教師なし3次元検出手法を提案する。
我々は、クラスタリング、トラッキング、ボックステキスト、ラベルリファインメントなど、LiDARポイントクラウドの固有のCLI時間知識を活用している。
提案手法はオープンデータセット上での最先端の非教師なし3Dオブジェクト検出器よりも優れている。
論文 参考訳(メタデータ) (2024-08-07T14:14:53Z) - Unsupervised Domain Adaptation for Self-Driving from Past Traversal
Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。
提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。
実世界のデータセットの実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-09-21T15:00:31Z) - Toward unlabeled multi-view 3D pedestrian detection by generalizable AI:
techniques and performance analysis [7.414308466976969]
汎用AIは、ラベルのないターゲットシーンにおける多視点3D歩行者検出を改善するために使用できる。
対象データの自動ラベル付けには,教師付き検出器を用いた擬似ラベル付けと教師なし検出器を用いた自動ラベル付けの2つの手法を検討する。
トレーニングされていない検出器をベースとした自動ラベリング手法を用いることで、トレーニングされていない検出器や既存のラベル付きソースデータセットでトレーニングした検出器を直接使用するよりも優れた結果が得られることを示す。
論文 参考訳(メタデータ) (2023-08-08T18:24:53Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - Supervision by Registration and Triangulation for Landmark Detection [70.13440728689231]
本稿では,マルチビュー映像を用いた教師なし手法である登録・三角測量(srt)による監視を行い,ランドマーク検出器の精度と精度を向上させる。
ラベルのないデータを活用することで、検出者は大量のラベルのないデータから自由に学べる。
論文 参考訳(メタデータ) (2021-01-25T02:48:21Z) - Move to See Better: Self-Improving Embodied Object Detection [35.461141354989714]
本研究では,テスト環境における物体検出の改善手法を提案する。
エージェントは、多視点データを収集し、2Dおよび3D擬似ラベルを生成し、その検出器を自己監督的に微調整する。
論文 参考訳(メタデータ) (2020-11-30T19:16:51Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。