論文の概要: Geometry-aware Temporal Aggregation Network for Monocular 3D Lane Detection
- arxiv url: http://arxiv.org/abs/2504.20525v1
- Date: Tue, 29 Apr 2025 08:10:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:54.806448
- Title: Geometry-aware Temporal Aggregation Network for Monocular 3D Lane Detection
- Title(参考訳): モノクローナル3次元レーン検出のための幾何学的時間集約ネットワーク
- Authors: Huan Zheng, Wencheng Han, Tianyi Yan, Cheng-zhong Xu, Jianbing Shen,
- Abstract要約: モノクロ3次元車線検出のためのジオメトリ対応テンポラルアグリゲーションネットワーク(GTA-Net)を提案する。
一方,連続するフレーム間の幾何的整合性を利用する時空間幾何拡張モジュール(TGEM)を開発した。
一方,TIQG(Temporal Instance-aware Query Generation)では,時間的キューをクエリ生成に戦略的に組み込む。
- 参考スコア(独自算出の注目度): 62.27919334393825
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Monocular 3D lane detection aims to estimate 3D position of lanes from frontal-view (FV) images. However, current monocular 3D lane detection methods suffer from two limitations, including inaccurate geometric information of the predicted 3D lanes and difficulties in maintaining lane integrity. To address these issues, we seek to fully exploit the potential of multiple input frames. First, we aim at enhancing the ability to perceive the geometry of scenes by leveraging temporal geometric consistency. Second, we strive to improve the integrity of lanes by revealing more instance information from temporal sequences. Therefore, we propose a novel Geometry-aware Temporal Aggregation Network (GTA-Net) for monocular 3D lane detection. On one hand, we develop the Temporal Geometry Enhancement Module (TGEM), which exploits geometric consistency across successive frames, facilitating effective geometry perception. On the other hand, we present the Temporal Instance-aware Query Generation (TIQG), which strategically incorporates temporal cues into query generation, thereby enabling the exploration of comprehensive instance information. Experiments demonstrate that our GTA-Net achieves SoTA results, surpassing existing monocular 3D lane detection solutions.
- Abstract(参考訳): モノクローナル3次元車線検出は,前頭側視(FV)画像から車線の3次元位置を推定することを目的としている。
しかし、現在の単分子3Dレーン検出法は、予測された3Dレーンの幾何学的不正確な情報や、レーンの整合性を維持するのに困難を含む2つの制限に悩まされている。
これらの問題に対処するために、我々は複数の入力フレームの可能性を完全に活用することを模索する。
まず,時間的幾何整合性を利用してシーンの幾何学的認識能力を高めることを目的とする。
第二に、時間的シーケンスからより多くの事例情報を明らかにすることにより、レーンの整合性を改善することに努める。
そこで本研究では,モノクロ3次元レーン検出のためのジオメトリ対応テンポラルアグリゲーションネットワーク(GTA-Net)を提案する。
一方,時間的幾何拡張モジュール (TGEM) は連続するフレーム間の幾何学的整合性を利用して,効果的な幾何学的知覚を容易にする。
一方、TIQG(Temporal Instance-aware Query Generation)では、時間的キューをクエリ生成に戦略的に組み込むことにより、包括的なインスタンス情報の探索を可能にする。
実験により,GTA-Netは既存の単分子3次元車線検出ソリューションを超越してSoTA結果が得られることが示された。
関連論文リスト
- MonoDGP: Monocular 3D Object Detection with Decoupled-Query and Geometry-Error Priors [24.753860375872215]
本稿では,MonoDGPと呼ばれるトランスフォーマーを用いたモノクロ3Dオブジェクト検出手法を提案する。
射影公式を変更するために、パースペクティブ不変幾何誤差を採用する。
提案手法は, 余分なデータを必要としないKITTIベンチマークにおいて, 最先端の性能を示す。
論文 参考訳(メタデータ) (2024-10-25T14:31:43Z) - LaneCPP: Continuous 3D Lane Detection using Physical Priors [45.52331418900137]
レーンCPPは、車線構造と道路形状に関する物理的事前知識を活用する連続した3次元車線検出モデルを用いる。
コントリビューションのメリットを示し、3次元車線検出をより堅牢にするための事前利用の意義を実証する。
論文 参考訳(メタデータ) (2024-06-12T16:31:06Z) - Invisible Stitch: Generating Smooth 3D Scenes with Depth Inpainting [75.7154104065613]
本稿では,3次元融合過程を学習するために,教師の蒸留と自己学習によって訓練された新しい深度補完モデルを提案する。
また,地上の真理幾何に基づくシーン生成手法のベンチマーク手法も導入した。
論文 参考訳(メタデータ) (2024-04-30T17:59:40Z) - OPA-3D: Occlusion-Aware Pixel-Wise Aggregation for Monocular 3D Object
Detection [51.153003057515754]
OPA-3Dは、Occlusion-Aware Pixel-Wise Aggregationネットワークである。
密集した風景深度と、奥行きのある箱残量と物の境界箱を共同で推定する。
メインカーのカテゴリーでは最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2022-11-02T14:19:13Z) - Reconstruct from Top View: A 3D Lane Detection Approach based on
Geometry Structure Prior [19.1954119672487]
本研究では,2次元から3次元のレーン再構成プロセスの下での幾何学的構造を利用して,単分子式3次元レーン検出問題に対する高度なアプローチを提案する。
まず, 3次元車線と地上2次元車線との形状を解析し, 先行構造に基づく明示的な監督を提案する。
第2に、2次元レーン表現における構造損失を低減するため、フロントビュー画像からトップビューレーン情報を直接抽出する。
論文 参考訳(メタデータ) (2022-06-21T04:03:03Z) - Cylindrical and Asymmetrical 3D Convolution Networks for LiDAR-based
Perception [122.53774221136193]
運転時のLiDARに基づく認識のための最先端の手法は、しばしば点雲を2D空間に投影し、2D畳み込みによって処理する。
自然な対策として、3Dボクセル化と3D畳み込みネットワークを利用する方法がある。
本研究では,3次元幾何学的パターンを探索するために,円筒状分割と非対称な3次元畳み込みネットワークを設計する,屋外LiDARセグメンテーションのための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-12T06:25:11Z) - Learning Geometry-Guided Depth via Projective Modeling for Monocular 3D Object Detection [70.71934539556916]
射影モデルを用いて幾何学誘導深度推定を学習し, モノクル3次元物体検出を推し進める。
具体的には,モノクロ3次元物体検出ネットワークにおける2次元および3次元深度予測の投影モデルを用いた原理的幾何式を考案した。
本手法は, 適度なテスト設定において, 余分なデータを2.80%も加えることなく, 最先端単分子法の検出性能を著しく向上させる。
論文 参考訳(メタデータ) (2021-07-29T12:30:39Z) - Geometry-aware data augmentation for monocular 3D object detection [18.67567745336633]
本稿では,自動運転システムにおける必須モジュールの一つであるモノキュラー3次元物体検出について述べる。
重要な課題は、深さ回復問題は単眼データに不備があることです。
我々は,既存の手法が,異なる幾何学的シフトが発生した場合の深さをロバストに推定できないことを明らかにするために,詳細な解析を行う。
上記の操作を,対応する4つの3D対応データ拡張手法に変換する。
論文 参考訳(メタデータ) (2021-04-12T23:12:48Z) - Road Curb Detection and Localization with Monocular Forward-view Vehicle
Camera [74.45649274085447]
魚眼レンズを装着した校正単眼カメラを用いて3Dパラメータを推定するロバストな手法を提案する。
我々のアプローチでは、車両が90%以上の精度で、リアルタイムで距離を抑えることができる。
論文 参考訳(メタデータ) (2020-02-28T00:24:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。