論文の概要: GUPNet++: Geometry Uncertainty Propagation Network for Monocular 3D
Object Detection
- arxiv url: http://arxiv.org/abs/2310.15624v1
- Date: Tue, 24 Oct 2023 08:45:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-25 19:49:30.211744
- Title: GUPNet++: Geometry Uncertainty Propagation Network for Monocular 3D
Object Detection
- Title(参考訳): gupnet++: 単眼3次元物体検出のための幾何不確かさ伝播ネットワーク
- Authors: Yan Lu, Xinzhu Ma, Lei Yang, Tianzhu Zhang, Yating Liu, Qi Chu, Tong
He, Yonghui Li, Wanli Ouyang
- Abstract要約: 我々はGUPNet++(Geometry Uncertainty Propagation Network)を提案する。
トレーニング中の幾何射影の不確実性伝播関係をモデル化し、エンドツーエンドのモデル学習の安定性と効率を向上させる。
実験により,提案手法は画像ベースモノクロ3次元検出におけるSOTA性能を得るだけでなく,簡易なフレームワークで有効性を示す。
- 参考スコア(独自算出の注目度): 95.8940731298518
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Geometry plays a significant role in monocular 3D object detection. It can be
used to estimate object depth by using the perspective projection between
object's physical size and 2D projection in the image plane, which can
introduce mathematical priors into deep models. However, this projection
process also introduces error amplification, where the error of the estimated
height is amplified and reflected into the projected depth. It leads to
unreliable depth inferences and also impairs training stability. To tackle this
problem, we propose a novel Geometry Uncertainty Propagation Network (GUPNet++)
by modeling geometry projection in a probabilistic manner. This ensures depth
predictions are well-bounded and associated with a reasonable uncertainty. The
significance of introducing such geometric uncertainty is two-fold: (1). It
models the uncertainty propagation relationship of the geometry projection
during training, improving the stability and efficiency of the end-to-end model
learning. (2). It can be derived to a highly reliable confidence to indicate
the quality of the 3D detection result, enabling more reliable detection
inference. Experiments show that the proposed approach not only obtains
(state-of-the-art) SOTA performance in image-based monocular 3D detection but
also demonstrates superiority in efficacy with a simplified framework.
- Abstract(参考訳): 幾何学は単眼3次元物体検出において重要な役割を担っている。
物体の物理的大きさと画像平面の2次元投影の間の視点投影を用いて物体の深さを推定することができ、深部モデルに数学的先行性を導入することができる。
しかし、このプロジェクションプロセスは、推定高さの誤差を増幅し、投影された深さに反映する誤差増幅も導入する。
信頼できない深さの推測を導き、トレーニングの安定性を損なう。
そこで本研究では,幾何投影を確率論的にモデル化し,新たな幾何不確かさ伝播ネットワーク(gupnet++)を提案する。
これにより、深さ予測が十分に拘束され、合理的な不確実性に結びつくことが保証される。
このような幾何学的不確実性を導入する意義は、2つある:(1)。
トレーニング中の幾何射影の不確かさ伝播関係をモデル化し、エンドツーエンドモデル学習の安定性と効率を向上させる。
(2).
3D検出結果の品質を示す信頼性の高い信頼性に導出することができ、より信頼性の高い検出推測を可能にする。
実験により,提案手法は画像ベースモノクロ3次元検出におけるSOTA性能を得るだけでなく,簡易なフレームワークによる有効性も示す。
関連論文リスト
- GEOcc: Geometrically Enhanced 3D Occupancy Network with Implicit-Explicit Depth Fusion and Contextual Self-Supervision [49.839374549646884]
本稿では,視覚のみのサラウンドビュー知覚に適したジオメトリ強化OccupancyネットワークであるGEOccについて述べる。
提案手法は,Occ3D-nuScenesデータセット上で,画像解像度が最小で,画像バックボーンが最大である状態-Of-The-Art性能を実現する。
論文 参考訳(メタデータ) (2024-05-17T07:31:20Z) - FrozenRecon: Pose-free 3D Scene Reconstruction with Frozen Depth Models [67.96827539201071]
本稿では,3次元シーン再構成のための新しいテスト時間最適化手法を提案する。
本手法は5つのゼロショットテストデータセット上で,最先端のクロスデータセット再構築を実現する。
論文 参考訳(メタデータ) (2023-08-10T17:55:02Z) - OriCon3D: Effective 3D Object Detection using Orientation and Confidence [0.0]
1つの画像から3次元物体を検出するための高度な手法を提案する。
我々は、深層畳み込みニューラルネットワークに基づく3Dオブジェクト重み付け指向回帰パラダイムを用いる。
提案手法は, 3次元オブジェクトのポーズ決定の精度を大幅に向上し, ベースライン法を超越した。
論文 参考訳(メタデータ) (2023-04-27T19:52:47Z) - Probabilistic and Geometric Depth: Detecting Objects in Perspective [78.00922683083776]
3次元物体検出は、運転支援システムなどの様々な実用用途で必要とされる重要な機能である。
双眼視やLiDARに頼っている従来の設定に比べて、経済的な解決策として単眼3D検出が注目されているが、それでも満足のいく結果が得られていない。
本稿ではまず,この問題に関する系統的研究を行い,現在の単分子3次元検出問題をインスタンス深度推定問題として単純化できることを考察する。
論文 参考訳(メタデータ) (2021-07-29T16:30:33Z) - Learning Geometry-Guided Depth via Projective Modeling for Monocular 3D Object Detection [70.71934539556916]
射影モデルを用いて幾何学誘導深度推定を学習し, モノクル3次元物体検出を推し進める。
具体的には,モノクロ3次元物体検出ネットワークにおける2次元および3次元深度予測の投影モデルを用いた原理的幾何式を考案した。
本手法は, 適度なテスト設定において, 余分なデータを2.80%も加えることなく, 最先端単分子法の検出性能を著しく向上させる。
論文 参考訳(メタデータ) (2021-07-29T12:30:39Z) - Geometry Uncertainty Projection Network for Monocular 3D Object
Detection [138.24798140338095]
本稿では,予測および学習段階の誤り増幅問題に対処するために,幾何不確実性予測ネットワーク(GUP Net)を提案する。
具体的には, GUPモジュールを提案し, 推定深さの幾何誘導不確かさを求める。
トレーニング段階では,エラー増幅による不安定性を低減するための階層型タスク学習戦略を提案する。
論文 参考訳(メタデータ) (2021-07-29T06:59:07Z) - MonoRUn: Monocular 3D Object Detection by Reconstruction and Uncertainty
Propagation [4.202461384355329]
我々は,高密度な対応や幾何学を自己教師型で学習する,新しい3次元オブジェクト検出フレームワークMonoRUnを提案する。
提案手法は,KITTIベンチマークの最先端手法より優れている。
論文 参考訳(メタデータ) (2021-03-23T15:03:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。