論文の概要: A Simple Attempt for 3D Occupancy Estimation in Autonomous Driving
- arxiv url: http://arxiv.org/abs/2303.10076v2
- Date: Tue, 4 Apr 2023 15:05:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-05 17:41:32.603646
- Title: A Simple Attempt for 3D Occupancy Estimation in Autonomous Driving
- Title(参考訳): 自律運転における3次元動作推定のための簡易試み
- Authors: Wanshui Gan, Ningkai Mo, Hongbin Xu, Naoto Yokoya
- Abstract要約: 本稿では,CNNをベースとした3次元占有率推定のための重要な要素をいくつか明らかにする。
評価のために, 占有度評価の指標を定義するための簡単なサンプリング戦略を提案する。
深度推定の指標として,新しいベンチマークを構築した。
- 参考スコア(独自算出の注目度): 15.34313154413423
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The task of estimating 3D occupancy from surrounding view images is an
exciting development in the field of autonomous driving, following the success
of Birds Eye View (BEV) perception.This task provides crucial 3D attributes of
the driving environment, enhancing the overall understanding and perception of
the surrounding space. However, there is still a lack of a baseline to define
the task, such as network design, optimization, and evaluation. In this work,
we present a simple attempt for 3D occupancy estimation, which is a CNN-based
framework designed to reveal several key factors for 3D occupancy estimation.
In addition, we explore the relationship between 3D occupancy estimation and
other related tasks, such as monocular depth estimation, stereo matching, and
BEV perception (3D object detection and map segmentation), which could advance
the study on 3D occupancy estimation. For evaluation, we propose a simple
sampling strategy to define the metric for occupancy evaluation, which is
flexible for current public datasets. Moreover, we establish a new benchmark in
terms of the depth estimation metric, where we compare our proposed method with
monocular depth estimation methods on the DDAD and Nuscenes datasets.The
relevant code will be available in
https://github.com/GANWANSHUI/SimpleOccupancy
- Abstract(参考訳): 周囲の視界画像から3次元の占有度を推定するタスクは、バードズアイビュー(BEV)の認識の成功に続く自動運転分野におけるエキサイティングな発展であり、このタスクは運転環境の重要な3次元特性を提供し、周囲の空間の全体的な理解と認識を高める。
しかし、ネットワーク設計、最適化、評価など、タスクを定義するためのベースラインが依然として欠けている。
本研究では,3次元占有率推定のためのいくつかの重要な要因を明らかにするために設計されたcnnベースのフレームワークである3次元占有率推定のための簡易な試みを提案する。
さらに,3次元占有率推定と,単眼深度推定,ステレオマッチング,BEV知覚(3Dオブジェクト検出,マップセグメンテーション)などの関連課題との関係について検討した。
評価のために,現在の公開データセットに柔軟である占有評価基準を定義するための簡単なサンプリング戦略を提案する。
さらに,提案手法とDDADおよびNuscenesデータセットの単眼深度推定手法を比較し,深度推定の指標として新しいベンチマークを構築した。関連コードはhttps://github.com/GANWANSHUI/SimpleOccupancyで利用可能である。
関連論文リスト
- Improving 3D Occupancy Prediction through Class-balancing Loss and Multi-scale Representation [7.651064601670273]
自動運転システムには3D環境認識が不可欠である。
Birds-Eye-View(BEV)に基づく認識は,このタスクのSOTA性能を達成している。
この問題を解決するために,新しいUNetライクなマルチスケールOccupancy Headモジュールを導入する。
論文 参考訳(メタデータ) (2024-05-25T07:13:13Z) - Vision-based 3D occupancy prediction in autonomous driving: a review and outlook [19.939380586314673]
本稿では,視覚に基づく3次元占有予測の背景を紹介し,その課題について論じる。
我々は3つの側面から視覚に基づく3D占有率予測の進捗状況を総合的に調査する。
代表的な研究動向を概説し,今後の展望を提案する。
論文 参考訳(メタデータ) (2024-05-04T07:39:25Z) - RadOcc: Learning Cross-Modality Occupancy Knowledge through Rendering
Assisted Distillation [50.35403070279804]
マルチビュー画像を用いた3次元シーンの占有状況とセマンティクスを推定することを目的とした,新たな課題である3D占有予測手法を提案する。
本稿では,RandOccを提案する。Rendering Assisted distillation paradigm for 3D Occupancy prediction。
論文 参考訳(メタデータ) (2023-12-19T03:39:56Z) - OccNeRF: Advancing 3D Occupancy Prediction in LiDAR-Free Environments [77.0399450848749]
本稿では,OccNeRF法を用いて,3次元監視なしで占有ネットワークを訓練する手法を提案する。
我々は、再構成された占有領域をパラメータ化し、サンプリング戦略を再編成し、カメラの無限知覚範囲に合わせる。
意味的占有予測のために,事前学習した開語彙2Dセグメンテーションモデルの出力をフィルタリングし,プロンプトを洗練するためのいくつかの戦略を設計する。
論文 参考訳(メタデータ) (2023-12-14T18:58:52Z) - Instance-aware Multi-Camera 3D Object Detection with Structural Priors
Mining and Self-Boosting Learning [93.71280187657831]
カメラによる鳥眼視(BEV)知覚パラダイムは、自律運転分野において大きな進歩を遂げている。
画像平面のインスタンス認識をBEV検出器内の深度推定プロセスに統合するIA-BEVを提案する。
論文 参考訳(メタデータ) (2023-12-13T09:24:42Z) - SOGDet: Semantic-Occupancy Guided Multi-view 3D Object Detection [19.75965521357068]
本稿では,SOGDet(Semantic-Occupancy Guided Multi-view Object Detection)と呼ばれる新しい手法を提案する。
以上の結果から,SOGDet は nuScenes Detection Score (NDS) と平均平均精度 (mAP) の3つのベースライン法の性能を一貫して向上させることがわかった。
これは、3Dオブジェクト検出と3Dセマンティック占有の組み合わせが、3D環境をより包括的に認識し、より堅牢な自律運転システムの構築を支援することを示唆している。
論文 参考訳(メタデータ) (2023-08-26T07:38:21Z) - HUM3DIL: Semi-supervised Multi-modal 3D Human Pose Estimation for
Autonomous Driving [95.42203932627102]
3Dの人間のポーズ推定は、自動運転車が歩行者の微妙で複雑な振る舞いを知覚し理解できるようにする新しい技術である。
提案手法は,これらの補完信号を半教師付き方式で効率的に利用し,既存の手法よりも大きなマージンで性能を向上する。
具体的には、LiDAR点を画素整列マルチモーダル特徴に埋め込み、トランスフォーマーの精細化段階を経る。
論文 参考訳(メタデータ) (2022-12-15T11:15:14Z) - ONCE-3DLanes: Building Monocular 3D Lane Detection [41.46466150783367]
OnCE-3DLanesは3次元空間にレーンレイアウトアノテーションを付加した実世界の自律走行データセットである。
点雲と画像ピクセルとの明確な関係を利用して、データセットのアノテーションパイプラインは、高品質な3Dレーンの位置を自動的に生成するように設計されている。
論文 参考訳(メタデータ) (2022-04-30T16:35:25Z) - From 2D to 3D: Re-thinking Benchmarking of Monocular Depth Prediction [80.67873933010783]
我々は,MDPが現在,3Dアプリケーションにおける予測の有用性を評価するのに有効な指標に頼っていることを論じる。
これにより、2Dベースの距離を最適化するのではなく、シーンの3D構造を正確に認識し、推定に向けて改善する新しい手法の設計と開発が制限される。
本稿では,MDP手法の3次元幾何評価に適した指標セットと,提案手法に不可欠な室内ベンチマークRIO-D3Dを提案する。
論文 参考訳(メタデータ) (2022-03-15T17:50:54Z) - Monocular Quasi-Dense 3D Object Tracking [99.51683944057191]
周囲の物体の将来の位置を予測し、自律運転などの多くのアプリケーションで観測者の行動を計画するためには、信頼性と正確な3D追跡フレームワークが不可欠である。
移動プラットフォーム上で撮影された2次元画像のシーケンスから,移動物体を時間とともに効果的に関連付け,その全3次元バウンディングボックス情報を推定するフレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-12T15:30:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。