論文の概要: Robust Video-Based Pothole Detection and Area Estimation for Intelligent Vehicles with Depth Map and Kalman Smoothing
- arxiv url: http://arxiv.org/abs/2505.21049v1
- Date: Tue, 27 May 2025 11:32:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-28 17:05:58.610486
- Title: Robust Video-Based Pothole Detection and Area Estimation for Intelligent Vehicles with Depth Map and Kalman Smoothing
- Title(参考訳): 深度マップとカルマン平滑化を用いたインテリジェント車両のロバストビデオによるポットホール検出と面積推定
- Authors: Dehao Wang, Haohang Zhu, Yiwen Xu, Kaiqi Liu,
- Abstract要約: 道路の穴は安全と快適を運転する上で深刻な脅威となり、その検出と評価は自動運転などの分野において重要な課題となる。
既存の視覚ベースの手法の多くは幾何学的モデルを構築するために距離先に依存している。
これらの問題に対処するために,ビデオストリームにおける物体検出と単眼深度推定を統合した頑健なポットホール面積推定フレームワークを提案する。
- 参考スコア(独自算出の注目度): 4.579830400562906
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Road potholes pose a serious threat to driving safety and comfort, making their detection and assessment a critical task in fields such as autonomous driving. When driving vehicles, the operators usually avoid large potholes and approach smaller ones at reduced speeds to ensure safety. Therefore, accurately estimating pothole area is of vital importance. Most existing vision-based methods rely on distance priors to construct geometric models. However, their performance is susceptible to variations in camera angles and typically relies on the assumption of a flat road surface, potentially leading to significant errors in complex real-world environments. To address these problems, a robust pothole area estimation framework that integrates object detection and monocular depth estimation in a video stream is proposed in this paper. First, to enhance pothole feature extraction and improve the detection of small potholes, ACSH-YOLOv8 is proposed with ACmix module and the small object detection head. Then, the BoT-SORT algorithm is utilized for pothole tracking, while DepthAnything V2 generates depth maps for each frame. With the obtained depth maps and potholes labels, a novel Minimum Bounding Triangulated Pixel (MBTP) method is proposed for pothole area estimation. Finally, Kalman Filter based on Confidence and Distance (CDKF) is developed to maintain consistency of estimation results across consecutive frames. The results show that ACSH-YOLOv8 model achieves an AP(50) of 76.6%, representing a 7.6% improvement over YOLOv8. Through CDKF optimization across consecutive frames, pothole predictions become more robust, thereby enhancing the method's practical applicability.
- Abstract(参考訳): 道路の穴は安全と快適を運転する上で深刻な脅威となり、その検出と評価は自動運転などの分野において重要な課題となる。
車両を運転する場合、オペレーターは通常大きな穴を回避し、より少ない速度で小さな穴に接近して安全性を確保する。
したがって, ポットホール面積を正確に推定することが重要である。
既存の視覚ベースの手法の多くは幾何学的モデルを構築するために距離先に依存している。
しかしながら、それらの性能はカメラアングルのバリエーションの影響を受けやすく、通常は平坦な路面の仮定に依存しており、複雑な現実世界環境において重大なエラーを引き起こす可能性がある。
これらの問題に対処するために,ビデオストリームにおける物体検出と単眼深度推定を統合した頑健なポットホール面積推定フレームワークを提案する。
まず,ACSH-YOLOv8をACmixモジュールと小型物体検出ヘッドで提案した。
そして、BoT-SORTアルゴリズムをポットホール追跡に利用し、DepthAnything V2は各フレームの深度マップを生成する。
得られた深度マップとポットホールラベルを用いて,ポットホール面積推定のための新しい最小境界三角レンズ (MBTP) 法を提案する。
最後に、連続フレーム間の推定結果の整合性を維持するために、信頼と距離に基づくカルマンフィルタ(CDKF)を開発した。
その結果、ACSH-YOLOv8モデルは76.6%のAP(50)を達成し、YOLOv8よりも7.6%改善した。
連続フレーム間のCDKF最適化により、ポットホール予測がより堅牢になり、メソッドの実用性を高める。
関連論文リスト
- An Enhanced YOLOv8 Model for Real-Time and Accurate Pothole Detection and Measurement [0.0]
既存の検出方法は、通常2次元RGB画像のみに基づいており、ポットホールの物理的特性を正確に分析することはできない。
本稿では, RGB-D画像のデータセット(PothRGBD)を作成し, ポットホール検出とポットホール物理特徴解析の両方に改良されたYOLOv8モデルを提案する。
論文 参考訳(メタデータ) (2025-05-07T07:58:57Z) - TacoDepth: Towards Efficient Radar-Camera Depth Estimation with One-stage Fusion [54.46664104437454]
一段核融合を用いた効率的かつ正確なレーダ・カメラ深度推定モデルであるTacoDepthを提案する。
具体的には、グラフベースのRadar構造抽出器とピラミッドベースのRadar融合モジュールを設計する。
従来の最先端のアプローチと比較して、TacoDepthは深さ精度と処理速度を12.8%、91.8%改善している。
論文 参考訳(メタデータ) (2025-04-16T05:25:04Z) - TopoSD: Topology-Enhanced Lane Segment Perception with SDMap Prior [70.84644266024571]
我々は、標準定義地図(SDMaps)を見るために知覚モデルを訓練することを提案する。
我々はSDMap要素をニューラル空間マップ表現やインスタンストークンにエンコードし、先行情報のような補完的な特徴を組み込む。
レーンセグメント表現フレームワークに基づいて、モデルはレーン、中心線、およびそれらのトポロジを同時に予測する。
論文 参考訳(メタデータ) (2024-11-22T06:13:42Z) - RoadScan: A Novel and Robust Transfer Learning Framework for Autonomous
Pothole Detection in Roads [0.0]
本研究では,ディープラーニングと画像処理技術を用いた新しいポットホール検出手法を提案する。
このシステムは、道路利用者に重大なリスクをもたらす道路上の穴の致命的な問題に対処することを目的としている。
論文 参考訳(メタデータ) (2023-08-07T10:47:08Z) - Monocular BEV Perception of Road Scenes via Front-to-Top View Projection [57.19891435386843]
本稿では,鳥の目視で道路配置と車両占有率によって形成された局所地図を再構築する新しい枠組みを提案する。
我々のモデルは1つのGPU上で25FPSで動作し、リアルタイムパノラマHDマップの再構築に有効である。
論文 参考訳(メタデータ) (2022-11-15T13:52:41Z) - RCLane: Relay Chain Prediction for Lane Detection [76.62424079494285]
本稿では,リレーチェーン予測に基づく車線検出手法を提案する。
当社の戦略では,TuSimple,CULane,CurveLanes,LLAMASの4つの主要なベンチマーク上で,最先端の新たなベンチマークを確立することが可能です。
論文 参考訳(メタデータ) (2022-07-19T16:48:39Z) - Probabilistic and Geometric Depth: Detecting Objects in Perspective [78.00922683083776]
3次元物体検出は、運転支援システムなどの様々な実用用途で必要とされる重要な機能である。
双眼視やLiDARに頼っている従来の設定に比べて、経済的な解決策として単眼3D検出が注目されているが、それでも満足のいく結果が得られていない。
本稿ではまず,この問題に関する系統的研究を行い,現在の単分子3次元検出問題をインスタンス深度推定問題として単純化できることを考察する。
論文 参考訳(メタデータ) (2021-07-29T16:30:33Z) - Rethinking Road Surface 3D Reconstruction and Pothole Detection: From
Perspective Transformation to Disparity Map Segmentation [34.27692655476825]
ポトホール検出は通常、構造エンジニアまたは認定検査官によって行われます。
本稿では,道路差マップ推定とセグメンテーションに基づく効率的なポットホール検出アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-12-19T22:41:23Z) - Road Curb Detection and Localization with Monocular Forward-view Vehicle
Camera [74.45649274085447]
魚眼レンズを装着した校正単眼カメラを用いて3Dパラメータを推定するロバストな手法を提案する。
我々のアプローチでは、車両が90%以上の精度で、リアルタイムで距離を抑えることができる。
論文 参考訳(メタデータ) (2020-02-28T00:24:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。