論文の概要: DR-SPAAM: A Spatial-Attention and Auto-regressive Model for Person
Detection in 2D Range Data
- arxiv url: http://arxiv.org/abs/2004.14079v2
- Date: Fri, 31 Jul 2020 16:43:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-08 14:29:09.399106
- Title: DR-SPAAM: A Spatial-Attention and Auto-regressive Model for Person
Detection in 2D Range Data
- Title(参考訳): DR-SPAAM:2次元距離データにおける人物検出のための空間的・自己回帰モデル
- Authors: Dan Jia, Alexander Hermans, and Bastian Leibe
- Abstract要約: 本研究では,異なるタイミングで得られたスキャンを組み合わせ,代替戦略を用いた人物検出ネットワークを提案する。
DR-SPAAMは、バックボーンネットワークから中間機能をテンプレートとして保持し、新しいスキャンが利用可能になったときにテンプレートをリカレントに更新する。
DROWデータセットでは,提案手法は既存の最先端技術よりも約4倍高速である。
- 参考スコア(独自算出の注目度): 81.06749792332641
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Detecting persons using a 2D LiDAR is a challenging task due to the low
information content of 2D range data. To alleviate the problem caused by the
sparsity of the LiDAR points, current state-of-the-art methods fuse multiple
previous scans and perform detection using the combined scans. The downside of
such a backward looking fusion is that all the scans need to be aligned
explicitly, and the necessary alignment operation makes the whole pipeline more
expensive -- often too expensive for real-world applications. In this paper, we
propose a person detection network which uses an alternative strategy to
combine scans obtained at different times. Our method, Distance Robust SPatial
Attention and Auto-regressive Model (DR-SPAAM), follows a forward looking
paradigm. It keeps the intermediate features from the backbone network as a
template and recurrently updates the template when a new scan becomes
available. The updated feature template is in turn used for detecting persons
currently in the scene. On the DROW dataset, our method outperforms the
existing state-of-the-art, while being approximately four times faster, running
at 87.2 FPS on a laptop with a dedicated GPU and at 22.6 FPS on an NVIDIA
Jetson AGX embedded GPU. We release our code in PyTorch and a ROS node
including pre-trained models.
- Abstract(参考訳): 2次元LiDARを用いた人物検出は,2次元範囲データの低情報化による課題である。
LiDAR点のばらつきによる問題を緩和するため、現在の最先端手法は複数の過去のスキャンを融合させ、組み合わせたスキャンを用いて検出を行う。
このような後方視の融合の欠点は、すべてのスキャンを明示的にアライメントする必要があること、そして必要なアライメント操作によってパイプライン全体のコストが高くなることだ。
本稿では,異なるタイミングで取得したスキャンを組み合わせるための代替戦略を用いた人物検出ネットワークを提案する。
距離ロバスト空間注意自動回帰モデル (DR-SPAAM) は前方視のパラダイムに従っている。
中間機能をbackboneネットワークからテンプレートとして保持し、新しいスキャンが利用可能になったときにテンプレートを更新します。
更新されたフィーチャーテンプレートは、現在シーンにいる人を検出するために使用される。
DROWデータセットでは,既存の最先端技術よりも約4倍高速で,専用GPUを搭載したラップトップで87.2FPS,NVIDIA Jetson AGX組み込みGPUで22.6FPSで動作する。
PyTorchと、事前トレーニングされたモデルを含むROSノードでコードをリリースします。
関連論文リスト
- What Matters in Range View 3D Object Detection [15.147558647138629]
ライダーベースの知覚パイプラインは複雑なシーンを解釈するために3Dオブジェクト検出モデルに依存している。
過去のレンジビュー文献に提案されている複数の手法を使わずに、レンジビュー3次元オブジェクト検出モデル間の最先端を実現する。
論文 参考訳(メタデータ) (2024-07-23T18:42:37Z) - 3DiffTection: 3D Object Detection with Geometry-Aware Diffusion Features [70.50665869806188]
3DiffTectionは、単一の画像から3Dオブジェクトを検出する最先端の方法である。
拡散モデルを微調整し、単一の画像に条件付けされた新しいビュー合成を行う。
さらに、検出監視により、ターゲットデータ上でモデルをトレーニングする。
論文 参考訳(メタデータ) (2023-11-07T23:46:41Z) - Fully Sparse Fusion for 3D Object Detection [69.32694845027927]
現在広く使われているマルチモーダル3D検出法は、通常、密度の高いBird-Eye-View特徴マップを使用するLiDARベースの検出器上に構築されている。
完全にスパースなアーキテクチャは、長距離知覚において非常に効率的であるため、注目を集めている。
本稿では,新たに出現するフルスパースアーキテクチャにおいて,画像のモダリティを効果的に活用する方法を検討する。
論文 参考訳(メタデータ) (2023-04-24T17:57:43Z) - MSF3DDETR: Multi-Sensor Fusion 3D Detection Transformer for Autonomous
Driving [0.0]
MSF3DDETR: 画像とLiDAR機能を融合して検出精度を向上させるマルチセンサフュージョン3D検出変換器アーキテクチャを提案する。
我々のエンドツーエンドのシングルステージ、アンカーフリー、NMSフリーネットワークは、マルチビューイメージとLiDARポイントクラウドを取り込み、3Dバウンディングボックスを予測する。
MSF3DDETRネットワークは、DeTRにインスパイアされたハンガリーのアルゴリズムに基づくバイパーティイトマッチングとセット・ツー・セット・ロスを使用して、nuScenesデータセット上でエンドツーエンドにトレーニングされている。
論文 参考訳(メタデータ) (2022-10-27T10:55:15Z) - P-STMO: Pre-Trained Spatial Temporal Many-to-One Model for 3D Human Pose
Estimation [78.83305967085413]
本稿では,2次元から3次元のポーズ推定作業のためのP-STMOモデルを提案する。
提案手法は,パラメータが少なく,計算オーバーヘッドが少なく,最先端の手法より優れている。
論文 参考訳(メタデータ) (2022-03-15T04:00:59Z) - Embracing Single Stride 3D Object Detector with Sparse Transformer [63.179720817019096]
自律走行のためのLiDARを用いた3次元物体検出では、物体サイズと入力シーンサイズとの比が2次元検出の場合に比べて有意に小さい。
多くの3D検出器は2D検出器の一般的な慣習に従っており、点雲の定量化後も特徴マップを分解する。
本稿では,SST(Single-stride Sparse Transformer)を提案する。
論文 参考訳(メタデータ) (2021-12-13T02:12:02Z) - 2nd Place Solution for Waymo Open Dataset Challenge - Real-time 2D
Object Detection [26.086623067939605]
本稿では,画像から2次元物体を検出するリアルタイム手法を提案する。
我々は、加速度RTを活用して、検出パイプラインの推論時間を最適化する。
我々のフレームワークはNvidia Tesla V100 GPU上で45.8ms/frameのレイテンシを実現する。
論文 参考訳(メタデータ) (2021-06-16T11:32:03Z) - Temp-Frustum Net: 3D Object Detection with Temporal Fusion [0.0]
3Dオブジェクト検出は、自動運転システムの中核コンポーネントです。
フレームバイフレームの3dオブジェクト検出はノイズ、視野障害、スパーシティに苦しむ。
これらの問題を緩和するための新しい時間融合モジュールを提案する。
論文 参考訳(メタデータ) (2021-04-25T09:08:14Z) - Self-Supervised Person Detection in 2D Range Data using a Calibrated
Camera [83.31666463259849]
2次元LiDARに基づく人検出器のトレーニングラベル(擬似ラベル)を自動生成する手法を提案する。
擬似ラベルで訓練または微調整された自己監視検出器が,手動アノテーションを用いて訓練された検出器を上回っていることを示した。
私達の方法は付加的な分類の努力なしで配置の間に人の探知器を改善する有効な方法です。
論文 参考訳(メタデータ) (2020-12-16T12:10:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。