論文の概要: Monocular 3D Lane Detection via Structure Uncertainty-Aware Network with Curve-Point Queries
- arxiv url: http://arxiv.org/abs/2511.13055v1
- Date: Mon, 17 Nov 2025 07:01:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:24.874896
- Title: Monocular 3D Lane Detection via Structure Uncertainty-Aware Network with Curve-Point Queries
- Title(参考訳): 曲線点列をもつ構造不確実性認識ネットワークによる単分子3次元線検出
- Authors: Ruixin Liu, Zejian Yuan,
- Abstract要約: MonoUncは、BEV(Bird's-eye view)のない3Dレーン検出器で、局所的な車線構造から得られるアレタリックな不確実性を明示的にモデル化する。
ONCE-3DLanesとOpenLaneデータセットの実験は、MonoUncが以前の最先端(SoTA)メソッドより優れていることを示した。
- 参考スコア(独自算出の注目度): 17.532686042065702
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Monocular 3D lane detection is challenged by aleatoric uncertainty arising from inherent observation noise. Existing methods rely on simplified geometric assumptions, such as independent point predictions or global planar modeling, failing to capture structural variations and aleatoric uncertainty in real-world scenarios. In this paper, we propose MonoUnc, a bird's-eye view (BEV)-free 3D lane detector that explicitly models aleatoric uncertainty informed by local lane structures. Specifically, 3D lanes are projected onto the front-view (FV) space and approximated by parametric curves. Guided by curve predictions, curve-point query embeddings are dynamically generated for lane point predictions in 3D space. Each segment formed by two adjacent points is modeled as a 3D Gaussian, parameterized by the local structure and uncertainty estimations. Accordingly, a novel 3D Gaussian matching loss is designed to constrain these parameters jointly. Experiments on the ONCE-3DLanes and OpenLane datasets demonstrate that MonoUnc outperforms previous state-of-the-art (SoTA) methods across all benchmarks under stricter evaluation criteria. Additionally, we propose two comprehensive evaluation metrics for ONCE-3DLanes, calculating the average and maximum bidirectional Chamfer distances to quantify global and local errors. Codes are released at https://github.com/lrx02/MonoUnc.
- Abstract(参考訳): 単分子3次元車線検出は、固有の観測ノイズから生じるアレタリックな不確実性に挑戦される。
既存の手法は、独立点予測や大域平面モデリングのような単純な幾何学的仮定を頼りにしており、実世界のシナリオにおける構造的変動やアレラトリック不確実性を捉えていない。
本稿では,局所的な車線構造から得られるアレータリック不確実性を明示的にモデル化した,鳥眼ビュー(BEV)のない3次元車線検出器MonoUncを提案する。
具体的には、3Dレーンはフロントビュー(FV)空間に投影され、パラメトリック曲線によって近似される。
曲線予測によって導かれる曲線点クエリの埋め込みは、3次元空間におけるレーン点予測のために動的に生成される。
2つの隣接点によって形成された各セグメントは、3次元ガウスとしてモデル化され、局所構造と不確実性推定によってパラメータ化される。
したがって,新しい3次元ガウス整合損失は,これらのパラメータを協調的に制約するように設計されている。
ONCE-3DLanesデータセットとOpenLaneデータセットの実験では、MonoUncはより厳格な評価基準の下で、すべてのベンチマークで以前の最先端(SoTA)メソッドより優れていることが示されている。
さらに, OnCE-3DLanes に対する2つの総合的評価指標を提案し, 平均および最大双方向チャムファー距離を算出し, グローバルおよび局所誤差を定量化する。
コードはhttps://github.com/lrx02/MonoUnc.comで公開されている。
関連論文リスト
- ProBA: Probabilistic Bundle Adjustment with the Bhattacharyya Coefficient [43.75661586211106]
ProBAは2次元観察と3次元シーン構造における不確実性を明示的にモデル化し、伝播する。
我々の手法は点のようなランドマークの代わりに3Dガウス的を用いる。
ProBAは、非構造化環境でデプロイされたSLAMシステムの実用性を高める。
論文 参考訳(メタデータ) (2025-05-27T08:07:00Z) - PF3plat: Pose-Free Feed-Forward 3D Gaussian Splatting [54.7468067660037]
PF3platは、設計選択を検証した包括的なアブレーション研究によってサポートされた、すべてのベンチマークに新しい最先端を設定します。
本フレームワークは,3DGSの高速,スケーラビリティ,高品質な3D再構成とビュー合成機能を活用している。
論文 参考訳(メタデータ) (2024-10-29T15:28:15Z) - Flexible 3D Lane Detection by Hierarchical Shape MatchingFlexible 3D Lane Detection by Hierarchical Shape Matching [29.038755629481035]
3次元車線検出は、様々な視覚条件、複雑な類型、厳密な精度要求のため、依然として未解決の問題である。
本稿では,点雲から3次元レーン線を正確に予測するために,エンドツーエンドのフレキシブルかつ階層的なレーン検出器を提案する。
論文 参考訳(メタデータ) (2024-08-13T19:04:23Z) - Decoupling the Curve Modeling and Pavement Regression for Lane Detection [67.22629246312283]
曲線に基づく車線表現は多くの車線検出法で一般的な手法である。
本稿では,曲線モデルと地上高さ回帰という2つの部分に分解することで,車線検出タスクに対する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2023-09-19T11:24:14Z) - CurveFormer: 3D Lane Detection by Curve Propagation with Curve Queries
and Attention [3.330270927081078]
3Dレーン検出は、自動運転システムにとって不可欠な部分である。
以前のCNNとTransformerベースの手法は、通常、フロントビューイメージから鳥の目視(BEV)特徴マップを生成する。
単段トランスフォーマーを用いた3次元レーンパラメータの直接計算法であるCurveFormerを提案する。
論文 参考訳(メタデータ) (2022-09-16T14:54:57Z) - GLENet: Boosting 3D Object Detectors with Generative Label Uncertainty Estimation [70.75100533512021]
本稿では,対象物の潜在的可算有界箱の多様性として,ラベルの不確実性問題を定式化する。
本稿では,条件付き変分オートエンコーダを応用した生成フレームワークであるGLENetを提案する。
GLENetが生成するラベルの不確実性はプラグアンドプレイモジュールであり、既存のディープ3D検出器に便利に統合することができる。
論文 参考訳(メタデータ) (2022-07-06T06:26:17Z) - Uncertainty-Aware Camera Pose Estimation from Points and Lines [101.03675842534415]
Perspective-n-Point-and-Line (Pn$PL) は、2D-3D特徴座標の3Dモデルに関して、高速で正確で堅牢なカメラローカライゼーションを目指している。
論文 参考訳(メタデータ) (2021-07-08T15:19:36Z) - Unsupervised Performance Analysis of 3D Face Alignment with a
Statistically Robust Confidence Test [32.43769049247355]
本稿では3次元顔アライメント(3DFA)の性能解析の問題点について述べる。
提案手法の中核となる要素は、予測されたランドマークとモデルランドマークの間の剛性変換の頑健な評価である。
その結果、提案手法は教師付きメトリクスと一致しており、予測されたランドマークと自動アノテーション付き3DFAデータセットの精度を測定できることがわかった。
論文 参考訳(メタデータ) (2020-04-14T14:33:57Z) - Robust 6D Object Pose Estimation by Learning RGB-D Features [59.580366107770764]
本稿では、この局所最適問題を解くために、回転回帰のための離散連続的な新しい定式化を提案する。
我々はSO(3)の回転アンカーを均一にサンプリングし、各アンカーから目標への制約付き偏差を予測し、最適な予測を選択するための不確実性スコアを出力する。
LINEMOD と YCB-Video の2つのベンチマーク実験により,提案手法が最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-02-29T06:24:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。