論文の概要: Lightweight Spatiotemporal Highway Lane Detection via 3D-ResNet and PINet with ROI-Aware Attention
- arxiv url: http://arxiv.org/abs/2604.02188v1
- Date: Thu, 02 Apr 2026 15:47:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.897376
- Title: Lightweight Spatiotemporal Highway Lane Detection via 3D-ResNet and PINet with ROI-Aware Attention
- Title(参考訳): ROIを考慮した3D-ResNetとPINetによる軽量時空間ハイウェイレーン検出
- Authors: Sorna Shanmuga Raja, Abdelhafid Zenati,
- Abstract要約: 本稿では,3D-ResNetエンコーダとPoint Instance Network (PINet)デコーダを統合する2つのモデルを提案する。
このアーキテクチャは、セントジョージ大学シティーの自律システム研究所でオフライントレーニングとリアルタイム推論によって検証されている。
- 参考スコア(独自算出の注目度): 0.5156484100374058
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a lightweight, end-to-end highway lane detection architecture that jointly captures spatial and temporal information for robust performance in real-world driving scenarios. Building on the strengths of 3D convolutional neural networks and instance segmentation, we propose two models that integrate a 3D-ResNet encoder with a Point Instance Network (PINet) decoder. The first model enhances multi-scale feature representation using a Feature Pyramid Network (FPN) and Self-Attention mechanism to refine spatial dependencies. The second model introduces a Region of Interest (ROI) detection head to selectively focus on lane-relevant regions, thereby improving precision and reducing computational complexity. Experiments conducted on the TuSimple dataset (highway driving scenarios) demonstrate that the proposed second model achieves 93.40% accuracy while significantly reducing false negatives. Compared to existing 2D and 3D baselines, our approach achieves improved performance with fewer parameters and reduced latency. The architecture has been validated through offline training and real-time inference in the Autonomous Systems Laboratory at City, St George's University of London. These results suggest that the proposed models are well-suited for integration into Advanced Driver Assistance Systems (ADAS), with potential scalability toward full Lane Assist Systems (LAS).
- Abstract(参考訳): 本稿では,実世界の運転シナリオにおいて,空間的および時間的情報を協調的に捕捉し,ロバストな性能を実現する軽量でエンドツーエンドなハイウェイレーン検出アーキテクチャを提案する。
3D畳み込みニューラルネットワークとインスタンスセグメンテーションの強みに基づいて、3D-ResNetエンコーダとポイントインスタンスネットワーク(PINet)デコーダを統合する2つのモデルを提案する。
最初のモデルは、FPN(Feature Pyramid Network)とSelf-Attentionメカニズムを用いて、空間依存を洗練するためのマルチスケールな特徴表現を強化する。
第2のモデルは、レーン関連領域に選択的に焦点を合わせるために、関心領域検出ヘッドを導入し、精度を改善し、計算複雑性を低減する。
TuSimpleデータセット(ハイウェイ駆動シナリオ)で実施された実験では、提案された第2モデルが93.40%の精度を実現し、偽陰性を大幅に低減した。
既存の2D, 3Dベースラインと比較して, パラメータが少なく, レイテンシも小さく, 性能改善を実現している。
このアーキテクチャは、セントジョージ大学シティーの自律システム研究所でオフライントレーニングとリアルタイム推論によって検証されている。
これらの結果は,提案モデルがアドバンスト・ドライバー・アシスト・システム(ADAS)との統合に適しており,フルレーン・アシスト・システム(LAS)へのスケーラビリティが期待できることを示唆している。
関連論文リスト
- RegFormer++: An Efficient Large-Scale 3D LiDAR Point Registration Network with Projection-Aware 2D Transformer [71.59462491691819]
本稿では,大規模クラウドアライメントを実現するために,RegFormer++と呼ばれる新しいエンド・ツー・エンド差動トランスフォーマネットワークを提案する。
元の3D座標を2次元投影位置に充填するため、設計したトランスフォーマーは2次元処理における高効率と3次元幾何情報からの精度の両面から恩恵を受けることができる。
KITTI、NuScenes、Argoverseのデータセットを用いた実験により、我々のモデルは精度と効率の両面で最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2026-03-15T09:03:10Z) - Enhancing Steering Estimation with Semantic-Aware GNNs [41.89219383258699]
ハイブリッドアーキテクチャは、時間的モデリングのための3Dニューラルネットワークモデルとリカレントニューラルネットワーク(RNN)を組み合わせる。
我々は4つのハイブリッド3Dモデルを評価し、いずれも2Dのみのベースラインを上回った。
我々は、KITTIデータセットに対するアプローチを検証し、2Dのみのモデルよりも71%改善した。
論文 参考訳(メタデータ) (2025-03-21T13:58:08Z) - Fast Occupancy Network [15.759329665907229]
Occupancy Networkは、エゴ車周辺の特定3次元空間におけるボクセルのカテゴリを予測する。
本稿では, 変形可能な2次元畳み込み層を用いて, BEV機能を3次元ボクセル機能に引き上げる, 単純かつ高速なOccupancy Networkモデルを提案する。
また、計算コストを少なくして性能を向上させるために、効率的なボクセル特徴ピラミッドネットワーク(FPN)モジュールを提案する。
論文 参考訳(メタデータ) (2024-12-10T03:46:03Z) - DM3D: Distortion-Minimized Weight Pruning for Lossless 3D Object Detection [42.07920565812081]
本稿では,3次元物体検出のための新しいトレーニング後の重み付け手法を提案する。
事前訓練されたモデルにおける冗長パラメータを決定し、局所性と信頼性の両方において最小限の歪みをもたらす。
本フレームワークは,ネットワーク出力の歪みを最小限に抑え,検出精度を最大に維持することを目的とする。
論文 参考訳(メタデータ) (2024-07-02T09:33:32Z) - Cross-Cluster Shifting for Efficient and Effective 3D Object Detection
in Autonomous Driving [69.20604395205248]
本稿では,自律運転における3次元物体検出のための3次元点検出モデルであるShift-SSDを提案する。
我々は、ポイントベース検出器の表現能力を解き放つために、興味深いクロスクラスタシフト操作を導入する。
我々は、KITTI、ランタイム、nuScenesデータセットに関する広範な実験を行い、Shift-SSDの最先端性能を実証した。
論文 参考訳(メタデータ) (2024-03-10T10:36:32Z) - UniTR: A Unified and Efficient Multi-Modal Transformer for
Bird's-Eye-View Representation [113.35352122662752]
屋外3次元知覚のためのマルチモーダルバックボーンUniTRを提案する。
UniTRは、統一されたモデリングと共有パラメータで様々なモダリティを処理する。
UniTRは基本的にタスクに依存しないバックボーンであり、異なる3D知覚タスクを自然にサポートする。
論文 参考訳(メタデータ) (2023-08-15T12:13:44Z) - DDU-Net: Dual-Decoder-U-Net for Road Extraction Using High-Resolution
Remote Sensing Images [19.07341794770722]
本稿では,Dual-Decoder-U-Net(DDU-Net)と呼ばれる深層ニューラルネットワークモデルを提案する。
提案したモデルは、最先端のDenseUNet、DeepLabv3+、D-LinkNetの6.5%、MIoUの平均インターセクションでは3.3%、F1スコアでは4%、4.8%、それぞれ2.1%を上回っている。
論文 参考訳(メタデータ) (2022-01-18T05:27:49Z) - A New Backbone for Hyperspectral Image Reconstruction [90.48427561874402]
3次元ハイパースペクトル画像(HSI)再構成は、スナップショット圧縮画像の逆過程を指す。
空間/スペクトル不変Residual U-Net、すなわちSSI-ResU-Netを提案する。
SSI-ResU-Net は浮動小数点演算の 77.3% 以上で競合する性能を実現する。
論文 参考訳(メタデータ) (2021-08-17T16:20:51Z) - SA-Det3D: Self-Attention Based Context-Aware 3D Object Detection [9.924083358178239]
本稿では,3次元物体検出におけるコンテキストモデリングのための2種類の自己注意法を提案する。
まず,現状のbev,voxel,ポイントベース検出器にペアワイズ自着機構を組み込む。
次に,ランダムにサンプリングされた位置の変形を学習することにより,最も代表的な特徴のサブセットをサンプリングするセルフアテンション変種を提案する。
論文 参考訳(メタデータ) (2021-01-07T18:30:32Z) - InfoFocus: 3D Object Detection for Autonomous Driving with Dynamic
Information Modeling [65.47126868838836]
動的情報モデリングを用いた新しい3次元オブジェクト検出フレームワークを提案する。
粗い予測は、ボクセルベースの領域提案ネットワークを介して第1段階で生成される。
大規模なnuScenes 3D検出ベンチマークで実験を行った。
論文 参考訳(メタデータ) (2020-07-16T18:27:08Z) - Spatial-Spectral Residual Network for Hyperspectral Image
Super-Resolution [82.1739023587565]
ハイパースペクトル画像超解像のための新しいスペクトル空間残差ネットワーク(SSRNet)を提案する。
提案手法は,2次元畳み込みではなく3次元畳み込みを用いて空間スペクトル情報の探索を効果的に行うことができる。
各ユニットでは空間的・時間的分離可能な3次元畳み込みを用いて空間的・スペクトル的な情報を抽出する。
論文 参考訳(メタデータ) (2020-01-14T03:34:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。