Fugu-MT 論文翻訳(概要): An Enhanced YOLOv8 Model for Real-Time and Accurate Pothole Detection and Measurement

論文の概要: An Enhanced YOLOv8 Model for Real-Time and Accurate Pothole Detection and Measurement

arxiv url: http://arxiv.org/abs/2505.04207v1
Date: Wed, 07 May 2025 07:58:57 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-08 19:07:36.007164
Title: An Enhanced YOLOv8 Model for Real-Time and Accurate Pothole Detection and Measurement
Title（参考訳）: リアルタイム・高精度ポトホール検出・計測のための改良型YOLOv8モデル
Authors: Mustafa Yurdakul, Şakir Tasdemir,
Abstract要約: 既存の検出方法は、通常2次元RGB画像のみに基づいており、ポットホールの物理的特性を正確に分析することはできない。本稿では, RGB-D画像のデータセット(PothRGBD)を作成し, ポットホール検出とポットホール物理特徴解析の両方に改良されたYOLOv8モデルを提案する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Potholes cause vehicle damage and traffic accidents, creating serious safety and economic problems. Therefore, early and accurate detection of potholes is crucial. Existing detection methods are usually only based on 2D RGB images and cannot accurately analyze the physical characteristics of potholes. In this paper, a publicly available dataset of RGB-D images (PothRGBD) is created and an improved YOLOv8-based model is proposed for both pothole detection and pothole physical features analysis. The Intel RealSense D415 depth camera was used to collect RGB and depth data from the road surfaces, resulting in a PothRGBD dataset of 1000 images. The data was labeled in YOLO format suitable for segmentation. A novel YOLO model is proposed based on the YOLOv8n-seg architecture, which is structurally improved with Dynamic Snake Convolution (DSConv), Simple Attention Module (SimAM) and Gaussian Error Linear Unit (GELU). The proposed model segmented potholes with irregular edge structure more accurately, and performed perimeter and depth measurements on depth maps with high accuracy. The standard YOLOv8n-seg model achieved 91.9% precision, 85.2% recall and 91.9% mAP@50. With the proposed model, the values increased to 93.7%, 90.4% and 93.8% respectively. Thus, an improvement of 1.96% in precision, 6.13% in recall and 2.07% in mAP was achieved. The proposed model performs pothole detection as well as perimeter and depth measurement with high accuracy and is suitable for real-time applications due to its low model complexity. In this way, a lightweight and effective model that can be used in deep learning-based intelligent transportation solutions has been acquired.
Abstract（参考訳）: ポットホールは車両の損傷と交通事故を引き起こし、深刻な安全と経済的問題を引き起こす。したがって、早期かつ正確な穴の発見が重要である。既存の検出方法は、通常2次元RGB画像のみに基づいており、ポットホールの物理的特性を正確に分析することはできない。本稿では, RGB-D画像の公開データセット(PothRGBD)を作成し, ポットホール検出とポットホール物理特徴解析の両方に改良されたYOLOv8モデルを提案する。 Intel RealSense D415の深度カメラは、道路表面からRGBと深度データを収集するために使われ、その結果1000枚の画像のPothRGBDデータセットが得られた。データは、セグメンテーションに適したYOLOフォーマットでラベル付けされた。 YOLOモデルは、動的スネーク変換(DSConv)、シンプル注意モジュール(SimAM)、ガウス誤差線形ユニット(GELU)で構造的に改善されたYOLOv8nセグアーキテクチャに基づいて提案されている。提案モデルでは, 不規則なエッジ構造を有するポットホールをより正確に分割し, 深度マップの周・深度測定を高精度に行った。標準のYOLOv8nセグモデルは91.9%の精度、85.2%のリコール、91.9%のmAP@50を達成した。提案されたモデルでは、それぞれ93.7%、90.4%、93.8%に上昇した。これにより精度が1.96%、リコールが6.13%、mAPが2.07%向上した。提案モデルでは, ポットホール検出に加えて, 近距離・深度測定を高精度に行うとともに, モデルの複雑さが低いため, リアルタイムの応用に適している。このようにして、ディープラーニングベースのインテリジェントトランスポートソリューションで使用できる、軽量で効果的なモデルが取得された。

関連論文リスト

Pseudo Depth Meets Gaussian: A Feed-forward RGB SLAM Baseline [64.42938561167402]
本稿では,3次元ガウス型SLAMとフィードフォワードリカレント予測モジュールを組み合わせたオンライン3次元再構成手法を提案する。このアプローチは、遅いテスト時間の最適化を高速なネットワーク推論に置き換え、トラッキング速度を大幅に改善する。提案手法は,最先端のSplaTAMと同等の性能を示しながら,追跡時間を90%以上削減する。
論文参考訳（メタデータ） (2025-08-06T16:16:58Z)
Robust Video-Based Pothole Detection and Area Estimation for Intelligent Vehicles with Depth Map and Kalman Smoothing [4.579830400562906]
道路の穴は安全と快適を運転する上で深刻な脅威となり、その検出と評価は自動運転などの分野において重要な課題となる。既存の視覚ベースの手法の多くは幾何学的モデルを構築するために距離先に依存している。これらの問題に対処するために,ビデオストリームにおける物体検出と単眼深度推定を統合した頑健なポットホール面積推定フレームワークを提案する。
論文参考訳（メタデータ） (2025-05-27T11:32:45Z)
Optimizing YOLO Architectures for Optimal Road Damage Detection and Classification: A Comparative Study from YOLOv7 to YOLOv10 [0.0]
本稿では,ディープラーニングモデルを用いた道路損傷検出のための総合ワークフローを提案する。ハードウェアの制約を満たすため、大きな画像が収穫され、軽量モデルが利用される。提案手法では,コーディネートアテンションレイヤを備えたカスタムYOLOv7モデルや,Tiny YOLOv7モデルなど,複数のモデルアーキテクチャを採用している。
論文参考訳（メタデータ） (2024-10-10T22:55:12Z)
Constellation Dataset: Benchmarking High-Altitude Object Detection for an Urban Intersection [7.419274609612015]
本研究では,高標高カメラで観測された都市景観の物体検出研究に適した13K画像のデータセットであるConstellationを紹介する。このデータセットは、歩行者の限られたピクセルフットプリントによって実証された小さな物体検出の問題を探索するキュレートされたデータの必要性に対処する。提案手法は, 車両と比較して小型歩行者の検出性能が低いことを観察し, データセット上での同時検出アーキテクチャの評価を行った。
論文参考訳（メタデータ） (2024-04-25T18:00:24Z)
Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。提案手法は平均精度(MAP)を約45.7%向上させる。この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文参考訳（メタデータ） (2023-11-21T19:49:13Z)
RGB-based Category-level Object Pose Estimation via Decoupled Metric Scale Recovery [72.13154206106259]
本研究では、6次元のポーズとサイズ推定を分離し、不完全なスケールが剛性変換に与える影響を緩和するパイプラインを提案する。具体的には,事前学習した単分子推定器を用いて局所的な幾何学的情報を抽出する。別個のブランチは、カテゴリレベルの統計に基づいてオブジェクトのメートル法スケールを直接復元するように設計されている。
論文参考訳（メタデータ） (2023-09-19T02:20:26Z)
RoadScan: A Novel and Robust Transfer Learning Framework for Autonomous Pothole Detection in Roads [0.0]
本研究では,ディープラーニングと画像処理技術を用いた新しいポットホール検出手法を提案する。このシステムは、道路利用者に重大なリスクをもたらす道路上の穴の致命的な問題に対処することを目的としている。
論文参考訳（メタデータ） (2023-08-07T10:47:08Z)
Optimizing Anchor-based Detectors for Autonomous Driving Scenes [22.946814647030667]
本稿では、自律走行シーンにおける一般的なアンカーベース検出器のモデル改善と推定時間最適化について要約する。高性能RCNN-RSおよびRetinaNet-RS検出フレームワークに基づいて,群衆シーンの小さな物体をよりよく検出するために,検出器に適応するための一連のフレームワークの改善について検討した。
論文参考訳（メタデータ） (2022-08-11T22:44:59Z)
EAutoDet: Efficient Architecture Search for Object Detection [110.99532343155073]
EAutoDetフレームワークは、1.4GPU日でオブジェクト検出のための実用的なバックボーンとFPNアーキテクチャを検出できる。本稿では,一方のエッジ上での候補演算の重みを共有し,それらを一つの畳み込みに集約することでカーネル再利用手法を提案する。特に、発見されたアーキテクチャは最先端のオブジェクト検出NAS法を超越し、120 FPSで40.1 mAP、49.2 mAP、41.3 FPSをCOCOテストデブセットで達成している。
論文参考訳（メタデータ） (2022-03-21T05:56:12Z)
Progressively Guided Alternate Refinement Network for RGB-D Salient Object Detection [63.18846475183332]
我々は,RGB-Dの高次物体検出のための効率的かつコンパクトなディープネットワークを開発することを目指している。そこで本研究では,改良のための改良ネットワークを提案する。我々のモデルは、既存の最先端のアプローチよりも大きなマージンで優れています。
論文参考訳（メタデータ） (2020-08-17T02:55:06Z)
ZoomNet: Part-Aware Adaptive Zooming Neural Network for 3D Object Detection [69.68263074432224]
ステレオ画像に基づく3D検出のためのZoomNetという新しいフレームワークを提案する。 ZoomNetのパイプラインは、通常の2Dオブジェクト検出モデルから始まり、左右のバウンディングボックスのペアを取得するために使用される。さらに,RGB画像のテクスチャキューを多用し,より正確な異質度推定を行うため,適応ズームという概念的に真直ぐなモジュールを導入する。
論文参考訳（メタデータ） (2020-03-01T17:18:08Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。