Fugu-MT 論文翻訳(概要): OpenOccupancy: A Large Scale Benchmark for Surrounding Semantic Occupancy Perception

論文の概要: OpenOccupancy: A Large Scale Benchmark for Surrounding Semantic Occupancy Perception

arxiv url: http://arxiv.org/abs/2303.03991v1
Date: Tue, 7 Mar 2023 15:43:39 GMT
ステータス: 翻訳完了
システム内更新日: 2023-03-08 14:46:58.664397
Title: OpenOccupancy: A Large Scale Benchmark for Surrounding Semantic Occupancy Perception
Title（参考訳）: openoccupancy: セマンティクス占有感を囲むための大規模ベンチマーク
Authors: Xiaofeng Wang, Zheng Zhu, Wenbo Xu, Yunpeng Zhang, Yi Wei, Xu Chi, Yun Ye, Dalong Du, Jiwen Lu, Xingang Wang
Abstract要約: 我々は,最初のセマンティック占有感評価ベンチマークであるOpenOccupancyを提案する。大規模なnuScenesデータセットを拡張した。周囲の占有感の複雑さを考慮し、粗い予測を洗練させるためにカスケード占領ネットワーク(CONET)を提案する。
参考スコア（独自算出の注目度）: 73.05425657479704
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Semantic occupancy perception is essential for autonomous driving, as automated vehicles require a fine-grained perception of the 3D urban structures. However, existing relevant benchmarks lack diversity in urban scenes, and they only evaluate front-view predictions. Towards a comprehensive benchmarking of surrounding perception algorithms, we propose OpenOccupancy, which is the first surrounding semantic occupancy perception benchmark. In the OpenOccupancy benchmark, we extend the large-scale nuScenes dataset with dense semantic occupancy annotations. Previous annotations rely on LiDAR points superimposition, where some occupancy labels are missed due to sparse LiDAR channels. To mitigate the problem, we introduce the Augmenting And Purifying (AAP) pipeline to ~2x densify the annotations, where ~4000 human hours are involved in the labeling process. Besides, camera-based, LiDAR-based and multi-modal baselines are established for the OpenOccupancy benchmark. Furthermore, considering the complexity of surrounding occupancy perception lies in the computational burden of high-resolution 3D predictions, we propose the Cascade Occupancy Network (CONet) to refine the coarse prediction, which relatively enhances the performance by ~30% than the baseline. We hope the OpenOccupancy benchmark will boost the development of surrounding occupancy perception algorithms.
Abstract（参考訳）: 自動運転車は3次元都市構造のきめ細かい認識を必要とするため、セマンティックな占有感は自動運転に不可欠である。しかし、既存の関連するベンチマークは都市のシーンに多様性がなく、フロントビューの予測のみを評価する。周辺知覚アルゴリズムの包括的ベンチマークに向けて,まず,周囲のセマンティック占有感評価ベンチマークであるOpenOccupancyを提案する。 OpenOccupancyベンチマークでは、大規模なnuScenesデータセットを、セマンティック占有アノテーションで拡張する。以前のアノテーションはLiDARの点重畳に依存しており、疎いLiDARチャネルのために一部の占有ラベルが欠落している。この問題を軽減するために、約4000人の人間がラベリングプロセスに関与しているアノテーションを2倍にするために、拡張および精製(aap)パイプラインを導入します。さらに、OpenOccupancyベンチマークでは、カメラベース、LiDARベース、マルチモーダルベースラインが確立されている。さらに, 周囲の占有感の複雑さが高解像度3次元予測の計算負担に関係していることを考慮し, 粗い予測を洗練するためのカスケード占有ネットワーク(CONET)を提案する。 openoccupancyベンチマークが、周囲の占有知覚アルゴリズムの開発を促進することを期待している。

関連論文リスト

TGP: Two-modal occupancy prediction with 3D Gaussian and sparse points for 3D Environment Awareness [13.68631587423815]
3Dセマンティックな占有力は、ロボット工学と自律運転環境知覚の分野において、急速に研究の焦点となっている。既存の占有予測タスクは、voxelやポイントクラウドベースのアプローチを使用してモデル化される。本稿では空間的位置と体積構造情報のバランスをとる3次元ガウス集合とスパース点に基づく2次元モーダル予測法を提案する。
論文参考訳（メタデータ） (2025-03-13T01:35:04Z)
EmbodiedOcc: Embodied 3D Occupancy Prediction for Vision-based Online Scene Understanding [63.99937807085461]
3D占有予測は周囲のシーンを包括的に記述する。既存のほとんどのメソッドは、1つか数つのビューからのオフラインの認識に焦点を当てている。具体化された3次元占有予測タスクを定式化し,ガウスをベースとしたEmbodiedOccフレームワークを提案する。
論文参考訳（メタデータ） (2024-12-05T17:57:09Z)
ALOcc: Adaptive Lifting-based 3D Semantic Occupancy and Cost Volume-based Flow Prediction [89.89610257714006]
既存の手法は、これらのタスクの要求に応えるために高い精度を優先する。本稿では,3次元セマンティック占有率予測とフロー推定のための一連の改善点を紹介する。私たちの純粋な時間的アーキテクチャフレームワークであるALOccは、速度と精度の最適なトレードオフを実現しています。
論文参考訳（メタデータ） (2024-11-12T11:32:56Z)
OPUS: Occupancy Prediction Using a Sparse Set [64.60854562502523]
学習可能なクエリの集合を用いて、占有された場所とクラスを同時に予測するフレームワークを提案する。 OPUSには、モデルパフォーマンスを高めるための非自明な戦略が組み込まれている。最も軽量なモデルではOcc3D-nuScenesデータセットの2倍 FPS に優れたRayIoUが得られる一方、最も重いモデルは6.1 RayIoUを上回ります。
論文参考訳（メタデータ） (2024-09-14T07:44:22Z)
Fully Sparse 3D Occupancy Prediction [37.265473869812816]
運転予測は自動運転において重要な役割を果たす。従来の手法は通常、密集した3Dボリュームを構築し、シーン固有の空間を無視し、高い計算コストを被る。我々は,SparseOccと呼ばれる,完全スパース占有ネットワークを新たに導入した。 SparseOccは最初、カメラのみの入力からスパース3D表現を再構築し、その後スパースクエリによって3Dスパース表現からセマンティック/インスタンス占有を予測する。
論文参考訳（メタデータ） (2023-12-28T16:54:53Z)
OccNeRF: Advancing 3D Occupancy Prediction in LiDAR-Free Environments [77.0399450848749]
本稿では,OccNeRF法を用いて,3次元監視なしで占有ネットワークを訓練する手法を提案する。我々は、再構成された占有領域をパラメータ化し、サンプリング戦略を再編成し、カメラの無限知覚範囲に合わせる。意味的占有予測のために,事前学習した開語彙2Dセグメンテーションモデルの出力をフィルタリングし,プロンプトを洗練するためのいくつかの戦略を設計する。
論文参考訳（メタデータ） (2023-12-14T18:58:52Z)
PointOcc: Cylindrical Tri-Perspective View for Point-based 3D Semantic Occupancy Prediction [72.75478398447396]
本稿では,点雲を効果的かつ包括的に表現する円筒型三重対視図を提案する。また,LiDAR点雲の距離分布を考慮し,円筒座標系における三点ビューを構築した。プロジェクション中に構造の詳細を維持するために空間群プーリングを使用し、各TPV平面を効率的に処理するために2次元バックボーンを採用する。
論文参考訳（メタデータ） (2023-08-31T17:57:17Z)
Scene as Occupancy [66.43673774733307]
OccNetは、カスケードと時間ボクセルデコーダを備えたビジョン中心のパイプラインで、3D占有を再構築する。 nuScenes上に構築された最初の高密度3D占有率ベンチマークであるOpenOccを提案する。
論文参考訳（メタデータ） (2023-06-05T13:01:38Z)
Occ3D: A Large-Scale 3D Occupancy Prediction Benchmark for Autonomous Driving [34.368848580725576]
我々は,任意のシーンに対して,濃密で可視性に配慮したラベルを生成するラベル生成パイプラインを開発した。このパイプラインは、ボクセルの密度化、推論、画像誘導ボクセル精製の3段階からなる。我々は、Occ3Dベンチマークにおいて優れた性能を示すCTF-Occネットワークと呼ばれる新しいモデルを提案する。
論文参考訳（メタデータ） (2023-04-27T17:40:08Z)
A Simple Framework for 3D Occupancy Estimation in Autonomous Driving [16.605853706182696]
本稿では,CNNをベースとした3次元占有率推定のための重要な要素をいくつか明らかにするフレームワークを提案する。また,3次元占有率推定と,単眼深度推定や3次元再構成などの関連課題との関係についても検討した。
論文参考訳（メタデータ） (2023-03-17T15:57:14Z)
Are We Ready for Vision-Centric Driving Streaming Perception? The ASAP Benchmark [23.872360763782037]
ASAPは、自律運転における視覚中心の知覚のオンラインパフォーマンスを評価する最初のベンチマークである。 12Hzの原画像の高フレームレートラベルを生成するためのアノテーション拡張パイプラインを提案する。 ASAPベンチマークでは、モデルランクが異なる制約の下で変化することを示す総合的な実験結果が示されている。
論文参考訳（メタデータ） (2022-12-17T16:32:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。