論文の概要: Stereo-based 3D Anomaly Object Detection for Autonomous Driving: A New Dataset and Baseline
- arxiv url: http://arxiv.org/abs/2507.09214v2
- Date: Tue, 19 Aug 2025 07:26:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-20 15:36:31.571662
- Title: Stereo-based 3D Anomaly Object Detection for Autonomous Driving: A New Dataset and Baseline
- Title(参考訳): 自律走行のためのステレオ3次元異常物体検出:新しいデータセットとベースライン
- Authors: Shiyi Mu, Zichong Gu, Hanqi Lyu, Yilin Gao, Shugong Xu,
- Abstract要約: 3D検出技術は自動運転の分野で広く利用されている。
道路上に現れる稀な異常カテゴリーでは、3D検出モデルはしばしば誤検出または異常検出に失敗する。
本稿では,ステレオによる3次元異常物体検出(S3AD)アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 10.933880236559604
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: 3D detection technology is widely used in the field of autonomous driving, with its application scenarios gradually expanding from enclosed highways to open conventional roads. For rare anomaly categories that appear on the road, 3D detection models trained on closed sets often misdetect or fail to detect anomaly objects. To address this risk, it is necessary to enhance the generalization ability of 3D detection models for targets of arbitrary shapes and to possess the capability to filter out anomalies. The generalization of 3D detection is limited by two factors: the coupled training of 2D and 3D, and the insufficient diversity in the scale distribution of training samples. This paper proposes a Stereo-based 3D Anomaly object Detection (S3AD) algorithm, which decouples the training strategy of 3D and 2D to release the generalization ability for arbitrary 3D foreground detection, and proposes an anomaly scoring algorithm based on foreground confidence prediction, achieving target-level anomaly scoring. In order to further verify and enhance the generalization of anomaly detection, we use a 3D rendering method to synthesize two augmented reality binocular stereo 3D detection datasets which named KITTI-AR. KITTI-AR extends upon KITTI by adding 97 new categories, totaling 6k pairs of stereo images. The KITTI-AR-ExD subset includes 39 common categories as extra training data to address the sparse sample distribution issue. Additionally, 58 rare categories form the KITTI-AR-OoD subset, which are not used in training to simulate zero-shot scenarios in real-world settings, solely for evaluating 3D anomaly detection. Finally, the performance of the algorithm and the dataset is verified in the experiments. (Code and dataset can be obtained at https://github.com/shiyi-mu/S3AD-Code).
- Abstract(参考訳): 3D検出技術は自動運転の分野で広く利用されており、その応用シナリオは周囲の高速道路から従来の道路へと徐々に拡大している。
道路上に現れる稀な異常カテゴリでは、閉じたセットで訓練された3D検出モデルは、しばしば誤検出または異常物体の検出に失敗する。
このリスクに対処するためには、任意の形状のターゲットに対する3次元検出モデルの一般化能力を高め、異常を除去する能力を有する必要がある。
3D検出の一般化は、2Dと3Dの併用トレーニングと、トレーニングサンプルのスケール分布の多様性の不足という2つの要因によって制限されている。
本稿では,3次元および2次元のトレーニング戦略を分離し,任意の3次元前景検出のための一般化能力を解放するステレオベース3次元異常物体検出(S3AD)アルゴリズムを提案する。
異常検出の一般化を更に検証し,拡張するために,KITTI-ARと名付けられた2つの拡張現実両眼ステレオ3D検出データセットを合成するために,3Dレンダリング法を用いる。
KITTI-ARはKITTIに97の新しいカテゴリを追加し、合計6kのステレオ画像を提供する。
KITTI-AR-ExDサブセットには、スパースサンプル配布問題に対処する余分なトレーニングデータとして39の共通カテゴリが含まれている。
さらに58の稀なカテゴリがKITTI-AR-OoDサブセットを形成しており、実世界のゼロショットシナリオをシミュレートするために訓練に使用されていない。
最後に,アルゴリズムとデータセットの性能を実験で検証する。
(コードとデータセットはhttps://github.com/shiyi-mu/S3AD-Code)。
関連論文リスト
- Spotting the Unexpected (STU): A 3D LiDAR Dataset for Anomaly Segmentation in Autonomous Driving [14.403130104985557]
本稿では,運転シナリオにおける異常セグメンテーションのための新しいデータセットを提案する。
これは、密集した3Dセマンティックラベリングによる道路異常セグメンテーションに焦点を当てた初めての公開データセットである。
データセットと評価コードは公開され、さまざまなアプローチのテストとパフォーマンスの比較が容易になります。
論文 参考訳(メタデータ) (2025-05-04T15:15:35Z) - Towards Zero-shot 3D Anomaly Localization [58.62650061201283]
3DzALは3D異常検出とローカライゼーションのためのパッチレベルの新しいコントラスト学習フレームワークである。
3DzALは最先端の異常検出および局所化性能より優れていることを示す。
論文 参考訳(メタデータ) (2024-12-05T16:25:27Z) - Training an Open-Vocabulary Monocular 3D Object Detection Model without 3D Data [57.53523870705433]
我々はOVM3D-Detと呼ばれる新しいオープン語彙単分子オブジェクト検出フレームワークを提案する。
OVM3D-Detは、入力または3Dバウンディングボックスを生成するために高精度のLiDARや3Dセンサーデータを必要としない。
オープンボキャブラリ2Dモデルと擬似LiDARを使用して、RGB画像に3Dオブジェクトを自動的にラベル付けし、オープンボキャブラリ単分子3D検出器の学習を促進する。
論文 参考訳(メタデータ) (2024-11-23T21:37:21Z) - CatFree3D: Category-agnostic 3D Object Detection with Diffusion [63.75470913278591]
本稿では,2次元検出と深度予測から3次元検出を分離するパイプラインを提案する。
また,3次元検出結果の正確な評価のために,正規化ハンガリー距離(NHD)指標も導入した。
論文 参考訳(メタデータ) (2024-08-22T22:05:57Z) - FGR: Frustum-Aware Geometric Reasoning for Weakly Supervised 3D Vehicle
Detection [81.79171905308827]
3Dアノテーションを使わずに点雲中の車両を検出するためのフラストラム対応幾何推論(FGR)を提案する。
本手法は粗い3次元セグメンテーションと3次元バウンディングボックス推定の2段階からなる。
2Dバウンディングボックスとスパースポイントクラウドだけで、3D空間内のオブジェクトを正確に検出できます。
論文 参考訳(メタデータ) (2021-05-17T07:29:55Z) - Delving into Localization Errors for Monocular 3D Object Detection [85.77319416168362]
単眼画像から3Dバウンディングボックスを推定することは、自動運転に不可欠な要素です。
本研究では, 各サブタスクがもたらす影響を定量化し, 局所化誤差を求めることが, モノクロ3次元検出の抑制に欠かせない要因である。
論文 参考訳(メタデータ) (2021-03-30T10:38:01Z) - ST3D: Self-training for Unsupervised Domain Adaptation on 3D
ObjectDetection [78.71826145162092]
点雲からの3次元物体検出における教師なし領域適応のための新しい領域適応型自己学習パイプラインST3Dを提案する。
当社のST3Dは、評価されたすべてのデータセットで最先端のパフォーマンスを達成し、KITTI 3Dオブジェクト検出ベンチマークで完全に監視された結果を超えます。
論文 参考訳(メタデータ) (2021-03-09T10:51:24Z) - Learning to Predict the 3D Layout of a Scene [0.3867363075280544]
本稿では,単一のRGB画像のみを使用する手法を提案し,LiDARセンサを持たないデバイスや車両に適用できるようにする。
KITTIデータセットは,クラスラベル付き道路交通シーン,2D境界ボックス,自由度7自由度3Dアノテーションで構成される。
我々は、公式のKITTIベンチマークで要求されるように、結合閾値70%の3次元交差で測定された適度に困難なデータに対して平均47.3%の平均精度を達成し、従来の最先端のRGBのみの手法よりも大きなマージンで上回った。
論文 参考訳(メタデータ) (2020-11-19T17:23:30Z) - SMOKE: Single-Stage Monocular 3D Object Detection via Keypoint
Estimation [3.1542695050861544]
3Dの向きとオブジェクトの変換を推定することは、インフラストラクチャレスの自律走行と運転に不可欠である。
SMOKEと呼ばれる新しい3次元オブジェクト検出手法を提案する。
構造的単純さにもかかわらず、提案するSMOKEネットワークは、KITTIデータセット上の既存のモノクル3D検出方法よりも優れている。
論文 参考訳(メタデータ) (2020-02-24T08:15:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。