論文の概要: Out-of-Distribution Semantic Occupancy Prediction
- arxiv url: http://arxiv.org/abs/2506.21185v1
- Date: Thu, 26 Jun 2025 12:44:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-27 19:53:10.077684
- Title: Out-of-Distribution Semantic Occupancy Prediction
- Title(参考訳): アウト・オブ・ディストリビューション・セマンティック職業予測
- Authors: Yuheng Zhang, Mengfei Duan, Kunyu Peng, Yuhang Wang, Ruiping Liu, Fei Teng, Kai Luo, Zhiyong Li, Kailun Yang,
- Abstract要約: 本稿では,3次元ボクセル空間におけるOoD検出をターゲットとした,アウト・オブ・ディストリビューション・セマンティック・アクシデンシー予測を提案する。
OccOoDは,OoD検出をVoxel-BEVプログレッシブフュージョン(VBPF)を用いた3次元セマンティック占有予測に統合する新しいフレームワークである。
実験の結果、OccOoDはAuROC67.34%、AuPRCr29.21%で最先端のOoD検出を実現し、競合占有率予測性能を維持した。
- 参考スコア(独自算出の注目度): 26.178096447889605
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D Semantic Occupancy Prediction is crucial for autonomous driving, providing a dense, semantically rich environmental representation. However, existing methods focus on in-distribution scenes, making them susceptible to Out-of-Distribution (OoD) objects and long-tail distributions, which increases the risk of undetected anomalies and misinterpretations, posing safety hazards. To address these challenges, we introduce Out-of-Distribution Semantic Occupancy Prediction, targeting OoD detection in 3D voxel space. To fill the gaps in the dataset, we propose a Synthetic Anomaly Integration Pipeline that injects synthetic anomalies while preserving realistic spatial and occlusion patterns, enabling the creation of two datasets: VAA-KITTI and VAA-KITTI-360. We introduce OccOoD, a novel framework integrating OoD detection into 3D semantic occupancy prediction, with Voxel-BEV Progressive Fusion (VBPF) leveraging an RWKV-based branch to enhance OoD detection via geometry-semantic fusion. Experimental results demonstrate that OccOoD achieves state-of-the-art OoD detection with an AuROC of 67.34% and an AuPRCr of 29.21% within a 1.2m region, while maintaining competitive occupancy prediction performance. The established datasets and source code will be made publicly available at https://github.com/7uHeng/OccOoD.
- Abstract(参考訳): 3Dセマンティック占領予測は自律運転に不可欠であり、密集したセマンティックな環境表現を提供する。
しかし、既存の手法では流通シーンに重点を置いており、アウト・オブ・ディストリビューション(OoD)オブジェクトやロングテールの分布に影響を受けやすくし、検出されていない異常や誤解釈のリスクを増大させ、安全上の危険を生じさせる。
これらの課題に対処するために,3次元ボクセル空間におけるOoD検出をターゲットとした,アウト・オブ・ディストリビューション・セマンティック占領予測を導入する。
データセットのギャップを埋めるために、現実的な空間的および閉塞パターンを維持しながら合成異常を注入するSynthetic Anomaly Integration Pipelineを提案し、VAA-KITTIとVAA-KITTI-360という2つのデータセットを作成する。
我々は,OoD検出を3次元セマンティック占有予測に統合する新しいフレームワークであるOccOoDを紹介し,Voxel-BEVプログレッシブフュージョン(VBPF)はRWKVベースのブランチを活用し,幾何学的セマンティックフュージョンによるOoD検出を強化する。
実験の結果、OccOoDはAuROC67.34%、AuPRCr29.21%で最先端のOoD検出を実現し、競合占有率予測性能を維持した。
確立されたデータセットとソースコードはhttps://github.com/7uHeng/OccOoDで公開されます。
関連論文リスト
- An Experimental Study on Joint Modeling for Sound Event Localization and Detection with Source Distance Estimation [3.2637535969755858]
3D SELDタスクは、ソース距離推定を統合することで制限に対処する。
本稿では,この課題に対処するための3つのアプローチを提案する。
提案手法は,DCASE 2024 Challenge Task 3において,関節モデリングの有効性を実証した。
論文 参考訳(メタデータ) (2025-01-18T12:57:21Z) - EmbodiedOcc: Embodied 3D Occupancy Prediction for Vision-based Online Scene Understanding [63.99937807085461]
3D占有予測は周囲のシーンを包括的に記述する。
既存のほとんどのメソッドは、1つか数つのビューからのオフラインの認識に焦点を当てている。
具体化された3次元占有予測タスクを定式化し,ガウスをベースとしたEmbodiedOccフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-05T17:57:09Z) - ALOcc: Adaptive Lifting-based 3D Semantic Occupancy and Cost Volume-based Flow Prediction [89.89610257714006]
既存の手法は、これらのタスクの要求に応えるために高い精度を優先する。
本稿では,3次元セマンティック占有率予測とフロー推定のための一連の改善点を紹介する。
私たちの純粋な時間的アーキテクチャフレームワークであるALOccは、速度と精度の最適なトレードオフを実現しています。
論文 参考訳(メタデータ) (2024-11-12T11:32:56Z) - FuzzRisk: Online Collision Risk Estimation for Autonomous Vehicles based on Depth-Aware Object Detection via Fuzzy Inference [6.856508678236828]
このフレームワークは異なるアルゴリズムから2組の予測を受け取り、不整合とファジィ推論による衝突リスクを関連付ける。
IoU(Intersection-over-Union)と深度差測定(deep discrepancy measure)に基づいて,2組の予測の不一致が3次元物体検出器の誤差と強く相関していることを実験的に検証した。
AV衝突率によく一致する既存のオフラインメトリックに対してファジィ推論システムを最適化する。
論文 参考訳(メタデータ) (2024-11-09T20:20:36Z) - Syn-to-Real Unsupervised Domain Adaptation for Indoor 3D Object Detection [50.448520056844885]
室内3次元物体検出における非教師なし領域適応のための新しいフレームワークを提案する。
合成データセット3D-FRONTから実世界のデータセットScanNetV2とSUN RGB-Dへの適応結果は、ソースオンリーベースラインよりも9.7%、9.1%のmAP25が顕著に改善されていることを示している。
論文 参考訳(メタデータ) (2024-06-17T08:18:41Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - RAANet: Range-Aware Attention Network for LiDAR-based 3D Object
Detection with Auxiliary Density Level Estimation [11.180128679075716]
自律運転のためのLiDARデータから3Dオブジェクトを検出するために,Range-Aware Attention Network (RAANet) が開発された。
RAANetはより強力なBEV機能を抽出し、優れた3Dオブジェクト検出を生成する。
nuScenesデータセットの実験により,提案手法がLiDARを用いた3Dオブジェクト検出の最先端手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-11-18T04:20:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。