Fugu-MT 論文翻訳(概要): Learned Non-Maximum Suppression for 3D Object Detection

論文の概要: Learned Non-Maximum Suppression for 3D Object Detection

arxiv url: http://arxiv.org/abs/2606.03568v1
Date: Tue, 02 Jun 2026 12:34:14 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-03 22:00:04.996808
Title: Learned Non-Maximum Suppression for 3D Object Detection
Title（参考訳）: 3次元物体検出のための学習された非最大抑圧
Authors: Timo Osterburg, Stefan Schütte, Torsten Bertram,
Abstract要約: この研究は、非最大抑圧(NMS)を置き換える2つの学習されたフィルタリングモジュールを導入している。 D2D-Rescoreはトランスフォーマーに基づく検出検出(D2D)の注意を、GossipNet3Dは鳥の目視で局所化されたメッセージパッシングを通じて2Dゴシップネットの概念を3Dに適応させる。
参考スコア（独自算出の注目度）: 1.2744523252873352
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Post-processing is a critical stage in LiDAR-based 3D object detection, where dense and overlapping proposals must be filtered for compact and reliable perception. This work introduces two learned filtering modules that replace heuristic non-maximum suppression (NMS) by leveraging relations among detections. D2D-Rescore employs transformer-based detection-to-detection (D2D) attention, while GossipNet3D adapts the 2D GossipNet concept to 3D through localized message passing in bird's-eye view. A metric-aware matching strategy aligned with the nuScenes evaluation protocol ensures consistent training and validation behavior, improving overall detection performance. Both approaches improve mean average precision (mAP), nuScenes detection score (NDS), and true positive quality compared to CircleNMS, particularly for small and infrequent classes, while adding minimal computational overhead. These results demonstrate that learned, detection-level filtering can enhance 3D detector reliability without modifying the base network, offering a principled alternative to heuristic suppression. Code is available at https://github.com/rst-tu-dortmund/learned-3d-nms .
Abstract（参考訳）: 後処理は、LiDARベースの3Dオブジェクト検出において重要な段階であり、高密度で重なり合う提案を、コンパクトで信頼性の高い知覚のためにフィルタリングする必要がある。この研究は、検出間の関係を活用することにより、ヒューリスティックな非最大抑圧(NMS)を置き換える2つの学習されたフィルタリングモジュールを導入する。 D2D-Rescoreはトランスフォーマーに基づく検出検出(D2D)の注意を、GossipNet3Dは鳥の目視で局所化されたメッセージパッシングを通じて2Dゴシップネットの概念を3Dに適応させる。 nuScenes評価プロトコルに適合したメトリック対応マッチング戦略により、一貫したトレーニングと検証の動作が保証され、全体的な検出性能が向上する。どちらのアプローチも平均精度(mAP)、nuScenes detection score(NDS)、そしてCircleNMSと比較して真の正の質を向上する。これらの結果から, ベースネットワークを変更せずに3次元検出器の信頼性を向上させることができ, ヒューリスティック抑制の代替となることが示唆された。コードはhttps://github.com/rst-tu-dortmund/learned-3d-nmsで入手できる。

関連論文リスト

Approaching Outside: Scaling Unsupervised 3D Object Detection from 2D Scene [22.297964850282177]
教師なし3次元検出のためのLiDAR-2D Self-paced Learning (LiSe)を提案する。 RGB画像は、正確な2Dローカライゼーションキューを提供するLiDARデータの貴重な補完となる。本フレームワークでは,適応型サンプリングと弱いモデルアグリゲーション戦略を組み込んだ自己評価学習パイプラインを考案する。
論文参考訳（メタデータ） (2024-07-11T14:58:49Z)
The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。 KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文参考訳（メタデータ） (2022-01-29T10:54:57Z)
Progressive Coordinate Transforms for Monocular 3D Object Detection [52.00071336733109]
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
論文参考訳（メタデータ） (2021-08-12T15:22:33Z)
Anchor-free 3D Single Stage Detector with Mask-Guided Attention for Point Cloud [79.39041453836793]
我々は、点雲をアンカーフリーで検出する新しい1段3次元検出器を開発した。ボクセルをベースとしたスパース3D特徴量からスパース2D特徴量マップに変換することでこれを克服する。検出信頼度スコアとバウンディングボックス回帰の精度との相関性を改善するために,IoUに基づく検出信頼度再校正手法を提案する。
論文参考訳（メタデータ） (2021-08-08T13:42:13Z)
ST3D: Self-training for Unsupervised Domain Adaptation on 3D ObjectDetection [78.71826145162092]
点雲からの3次元物体検出における教師なし領域適応のための新しい領域適応型自己学習パイプラインST3Dを提案する。当社のST3Dは、評価されたすべてのデータセットで最先端のパフォーマンスを達成し、KITTI 3Dオブジェクト検出ベンチマークで完全に監視された結果を超えます。
論文参考訳（メタデータ） (2021-03-09T10:51:24Z)
End-to-End Pseudo-LiDAR for Image-Based 3D Object Detection [62.34374949726333]
擬似LiDAR(PL)は、LiDARセンサに基づく手法と安価なステレオカメラに基づく手法の精度ギャップを劇的に減らした。 PLは最先端のディープニューラルネットワークと2D深度マップ出力を3Dポイントクラウド入力に変換することで3Dオブジェクト検出のための3D深度推定を組み合わせている。我々は、PLパイプライン全体をエンドツーエンドにトレーニングできるように、差別化可能なRepresentation (CoR)モジュールに基づく新しいフレームワークを導入します。
論文参考訳（メタデータ） (2020-04-07T02:18:38Z)
SMOKE: Single-Stage Monocular 3D Object Detection via Keypoint Estimation [3.1542695050861544]
3Dの向きとオブジェクトの変換を推定することは、インフラストラクチャレスの自律走行と運転に不可欠である。 SMOKEと呼ばれる新しい3次元オブジェクト検出手法を提案する。構造的単純さにもかかわらず、提案するSMOKEネットワークは、KITTIデータセット上の既存のモノクル3D検出方法よりも優れている。
論文参考訳（メタデータ） (2020-02-24T08:15:36Z)
SESS: Self-Ensembling Semi-Supervised 3D Object Detection [138.80825169240302]
具体的には、ラベルのない新しい未知のデータに基づくネットワークの一般化を促進するための、徹底的な摂動スキームを設計する。我々のSESSは、50%のラベル付きデータを用いて、最先端の完全教師付き手法と比較して、競争性能を達成している。
論文参考訳（メタデータ） (2019-12-26T08:48:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。