論文の概要: Fast Attention-Based Simplification of LiDAR Point Clouds for Object Detection and Classification
- arxiv url: http://arxiv.org/abs/2603.07593v1
- Date: Sun, 08 Mar 2026 11:38:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:14.894854
- Title: Fast Attention-Based Simplification of LiDAR Point Clouds for Object Detection and Classification
- Title(参考訳): 物体検出・分類のためのLiDAR点雲の高速注意に基づく簡易化
- Authors: Z. Rozsa, Á. Madaras, Q. Wei, X. Lu, M. Golarits, H. Yuan, T. Sziranyi, R. Hamzaoui,
- Abstract要約: 本稿では,LiDARデータに対する効率的な学習点クラウド単純化手法を提案する。
特徴埋め込みモジュールと注目に基づくサンプリングモジュールを組み合わせてタスク関連領域を優先順位付けする。
我々は,KITTIデータセット上の3次元オブジェクト検出と4つのデータセット間のオブジェクト分類において,FPS(Farthest Point sample)とランダムサンプリング(RS)の手法を評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: LiDAR point clouds are widely used in autonomous driving and consist of large numbers of 3D points captured at high frequency to represent surrounding objects such as vehicles, pedestrians, and traffic signs. While this dense data enables accurate perception, it also increases computational cost and power consumption, which can limit real-time deployment. Existing point cloud sampling methods typically face a trade-off: very fast approaches tend to reduce accuracy, while more accurate methods are computationally expensive. To address this limitation, we propose an efficient learned point cloud simplification method for LiDAR data. The method combines a feature embedding module with an attention-based sampling module to prioritize task-relevant regions and is trained end-to-end. We evaluate the method against farthest point sampling (FPS) and random sampling (RS) on 3D object detection on the KITTI dataset and on object classification across four datasets. The method was consistently faster than FPS and achieved similar, and in some settings better, accuracy, with the largest gains under aggressive downsampling. It was slower than RS, but it typically preserved accuracy more reliably at high sampling ratios.
- Abstract(参考訳): LiDARの点雲は自動運転に広く使われており、車両、歩行者、交通標識などの周囲の物体を表すために高頻度で捕獲された多数の3Dポイントで構成されている。
この高密度データは正確な認識を可能にするが、計算コストと消費電力も増加し、リアルタイムのデプロイメントを制限できる。
既存のクラウドサンプリング手法は一般的にトレードオフに直面している。非常に高速なアプローチは精度を低下させがちであるが、より正確な手法は計算に高価である。
この制限に対処するために,LiDARデータに対する効率的な学習点クラウド単純化手法を提案する。
本手法は,特徴埋め込みモジュールと注目に基づくサンプリングモジュールを組み合わせ,タスク関連領域の優先順位付けを行い,エンドツーエンドで訓練する。
我々は,KITTIデータセット上の3次元オブジェクト検出と4つのデータセット間のオブジェクト分類において,FPS(Farthest Point sample)とランダムサンプリング(RS)の手法を評価する。
この手法は一貫してFPSよりも高速であり、いくつかの設定では精度が向上し、アグレッシブなダウンサンプリングで最大のゲインを得た。
RSよりも遅いが、通常、高いサンプリング比で精度を確実に保持する。
関連論文リスト
- PTT: Point-Trajectory Transformer for Efficient Temporal 3D Object Detection [66.94819989912823]
時間的3次元物体検出を効率的に行うために,長期記憶が可能な点トラジェクトリ変換器を提案する。
私たちは、メモリバンクのストレージ要件を最小限に抑えるために、現在のフレームオブジェクトのポイントクラウドとその履歴トラジェクトリを入力として使用します。
大規模データセットに対する広範な実験を行い、我々のアプローチが最先端の手法に対してうまく機能することを実証した。
論文 参考訳(メタデータ) (2023-12-13T18:59:13Z) - PV-SSD: A Multi-Modal Point Cloud Feature Fusion Method for Projection Features and Variable Receptive Field Voxel Features [1.5338480419018068]
非常にスパースな3Dデータからのリアルタイム推論は、非常に難しい課題だ。
この問題に対処するため、典型的なアプローチのクラスは、点雲のキャストを正規のデータ表現に変換する。
本稿では,射影特徴と可変受容野ボクセル特徴に対するマルチモーダル点雲特徴融合法を提案する。
論文 参考訳(メタデータ) (2023-08-13T15:30:02Z) - Grad-PU: Arbitrary-Scale Point Cloud Upsampling via Gradient Descent
with Learned Distance Functions [77.32043242988738]
我々は、任意のアップサンプリングレートをサポートする、正確なポイントクラウドアップサンプリングのための新しいフレームワークを提案する。
提案手法は,まず,所定のアップサンプリング率に応じて低解像度の雲を補間する。
論文 参考訳(メタデータ) (2023-04-24T06:36:35Z) - IC-FPS: Instance-Centroid Faster Point Sampling Module for 3D Point-base
Object Detection [0.5249805590164902]
本研究は,大規模クラウド上でのポイントベース手法の低効率化に焦点をあてる。
既存の点ベース手法では、ダウンサンプリングのための極端点サンプリング(FPS)戦略を採用している。
本稿では,非常に面倒な最初のSet Abstraction (SA) レイヤを効果的に置き換える新しいインスタンス・センタロイド高速点サンプリングモジュール (IC-FPS) を提案する。
論文 参考訳(メタデータ) (2023-03-31T09:31:29Z) - Roadside Lidar Vehicle Detection and Tracking Using Range And Intensity
Background Subtraction [0.0]
本稿では,2つの教師なし学習アルゴリズムを組み合わせた道路側LiDAR物体検出手法を提案する。
この手法は商用トラフィックデータ収集プラットフォームに対して検証された。
論文 参考訳(メタデータ) (2022-01-13T00:54:43Z) - Revisiting Point Cloud Simplification: A Learnable Feature Preserving
Approach [57.67932970472768]
MeshとPoint Cloudの単純化手法は、3Dモデルの複雑さを低減しつつ、視覚的品質と関連する健全な機能を維持することを目的としている。
そこで本研究では,正解点の標本化を学習し,高速点雲の簡易化手法を提案する。
提案手法は、入力空間から任意のユーザ定義の点数を選択し、視覚的知覚誤差を最小限に抑えるために、その位置を再配置するよう訓練されたグラフニューラルネットワークアーキテクチャに依存する。
論文 参考訳(メタデータ) (2021-09-30T10:23:55Z) - Learning Semantic Segmentation of Large-Scale Point Clouds with Random
Sampling [52.464516118826765]
我々はRandLA-Netを紹介した。RandLA-Netは、大規模ポイントクラウドのポイントごとの意味を推論する、効率的で軽量なニューラルネットワークアーキテクチャである。
我々のアプローチの鍵は、より複雑な点選択アプローチではなく、ランダムな点サンプリングを使用することである。
我々のRandLA-Netは、既存のアプローチよりも最大200倍高速な1回のパスで100万ポイントを処理できます。
論文 参考訳(メタデータ) (2021-07-06T05:08:34Z) - 3DSSD: Point-based 3D Single Stage Object Detector [61.67928229961813]
本稿では,3DSSDと命名された点ベース3次元単段物体検出器を提案し,精度と効率のバランスが良好であることを示す。
提案手法は,最先端のボクセルをベースとした一段法を大差で上回り,二段法に匹敵する性能を有する。
論文 参考訳(メタデータ) (2020-02-24T12:01:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。