論文の概要: An Improved ResNet50 Model for Predicting Pavement Condition Index (PCI) Directly from Pavement Images
- arxiv url: http://arxiv.org/abs/2504.18490v1
- Date: Fri, 25 Apr 2025 17:00:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:53.84952
- Title: An Improved ResNet50 Model for Predicting Pavement Condition Index (PCI) Directly from Pavement Images
- Title(参考訳): 舗装画像から直接舗装条件指標(PCI)を予測するResNet50モデルの改良
- Authors: Andrews Danyo, Anthony Dontoh, Armstrong Aboah,
- Abstract要約: 本研究では,Residual Network (ResNet50) アーキテクチャの拡張版を提案し,CBAM (Convolutional Block Attention Module) と統合した。
CBAMを組み込むことで、モデルは画像内の重要な特徴を自律的に優先順位付けし、予測精度を向上させる。
- 参考スコア(独自算出の注目度): 3.9599054392856483
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Accurately predicting the Pavement Condition Index (PCI), a measure of roadway conditions, from pavement images is crucial for infrastructure maintenance. This study proposes an enhanced version of the Residual Network (ResNet50) architecture, integrated with a Convolutional Block Attention Module (CBAM), to predict PCI directly from pavement images without additional annotations. By incorporating CBAM, the model autonomously prioritizes critical features within the images, improving prediction accuracy. Compared to the original baseline ResNet50 and DenseNet161 architectures, the enhanced ResNet50-CBAM model achieved a significantly lower mean absolute percentage error (MAPE) of 58.16%, compared to the baseline models that achieved 70.76% and 65.48% respectively. These results highlight the potential of using attention mechanisms to refine feature extraction, ultimately enabling more accurate and efficient assessments of pavement conditions. This study emphasizes the importance of targeted feature refinement in advancing automated pavement analysis through attention mechanisms.
- Abstract(参考訳): 舗装画像から道路条件の指標である舗装条件指数(PCI)の正確な予測は,インフラ整備に不可欠である。
本研究では,Residual Network (ResNet50) アーキテクチャをCBAM (Convolutional Block Attention Module) と統合した拡張版を提案し,PCIを付加アノテーションなしで舗装画像から直接予測する。
CBAMを組み込むことで、モデルは画像内の重要な特徴を自律的に優先順位付けし、予測精度を向上させる。
オリジナルのベースラインであるResNet50とDenseNet161アーキテクチャと比較して、拡張されたResNet50-CBAMモデルは、それぞれ70.76%と65.48%を達成したベースラインモデルに比べて、平均パーセンテージエラー(MAPE)が58.16%大幅に低くなった。
これらの結果は, 特徴抽出に注意機構を用いることによって, 舗装条件のより正確かつ効率的な評価を可能にする可能性を強調した。
本研究では,アテンション機構による自動舗装解析における特徴改善の重要性を強調した。
関連論文リスト
- A Simple and Generalist Approach for Panoptic Segmentation [57.94892855772925]
本稿では,深部エンコーダ-浅部デコーダアーキテクチャに基づく簡易な一般化フレームワークを提案する。
これはトレーニング中の不均衡に起因することを示し、その削減のための新しい方法を提案する。
提案手法は,MS-COCOデータセット上で55.1のPQを実現する。
論文 参考訳(メタデータ) (2024-08-29T13:02:12Z) - PaveCap: The First Multimodal Framework for Comprehensive Pavement Condition Assessment with Dense Captioning and PCI Estimation [3.6248657646376707]
自動舗装条件評価のための新しいフレームワークPaveCapを紹介する。
このフレームワークは、Single-Shot PCI Estimation NetworkとDense Captioning Networkの2つの主要な部分で構成されている。
論文 参考訳(メタデータ) (2024-08-07T22:23:13Z) - Isomorphic Pruning for Vision Models [56.286064975443026]
構造化プルーニングは、冗長なサブ構造を取り除くことによって、ディープニューラルネットワークの計算オーバーヘッドを低減する。
Isomorphic Pruningは、ネットワークアーキテクチャの範囲で有効性を示すシンプルなアプローチである。
論文 参考訳(メタデータ) (2024-07-05T16:14:53Z) - Cycle-YOLO: A Efficient and Robust Framework for Pavement Damage Detection [13.221462950649467]
本稿では,CycleGANと改良YOLOv5アルゴリズムを用いた舗装損傷検出手法を提案する。
本アルゴリズムは, 3種類の舗装損傷(き裂, 穴, パッチ)を検出する場合, 0.872, 0.854, 平均精度@0.5, 0.882, 平均精度@0.5を達成した。
論文 参考訳(メタデータ) (2024-05-28T07:27:42Z) - Enhancing Ship Classification in Optical Satellite Imagery: Integrating Convolutional Block Attention Module with ResNet for Improved Performance [1.4659076103416173]
光衛星画像に基づく船舶分類のための高度な畳み込みニューラルネットワーク(CNN)アーキテクチャを提案する。
最初に標準CBAMを導入し、より情報的な特徴に焦点を向け、87%の精度でモデルに焦点をあてた。
このモデルでは95%の精度を示し、精度、リコール、F1は様々な船級で大幅な改善が見られた。
論文 参考訳(メタデータ) (2024-04-02T17:48:46Z) - Systematic Architectural Design of Scale Transformed Attention Condenser
DNNs via Multi-Scale Class Representational Response Similarity Analysis [93.0013343535411]
マルチスケールクラス表現応答類似性分析(ClassRepSim)と呼ばれる新しいタイプの分析法を提案する。
ResNetスタイルのアーキテクチャにSTACモジュールを追加すると、最大1.6%の精度が向上することを示す。
ClassRepSim分析の結果は、STACモジュールの効果的なパラメータ化を選択するために利用することができ、競争性能が向上する。
論文 参考訳(メタデータ) (2023-06-16T18:29:26Z) - A Computer Vision Enabled damage detection model with improved YOLOv5
based on Transformer Prediction Head [0.0]
現在の最先端ディープラーニング(DL)に基づく損傷検出モデルは、複雑でノイズの多い環境では優れた特徴抽出能力を欠いていることが多い。
DenseSPH-YOLOv5は、DenseNetブロックをバックボーンに統合したリアルタイムDLベースの高性能損傷検出モデルである。
DenseSPH-YOLOv5は平均平均精度(mAP)が85.25%、F1スコアが81.18%、精度(P)が89.51%である。
論文 参考訳(メタデータ) (2023-03-07T22:53:36Z) - Improving Visual Grounding by Encouraging Consistent Gradient-based
Explanations [58.442103936918805]
注意マスク整合性は,従来の方法よりも優れた視覚的グラウンドリング結果が得られることを示す。
AMCは効率的で実装が容易であり、どんな視覚言語モデルでも採用できるため一般的である。
論文 参考訳(メタデータ) (2022-06-30T17:55:12Z) - SmoothNets: Optimizing CNN architecture design for differentially
private deep learning [69.10072367807095]
DPSGDは、サンプルごとの勾配の切り抜きとノイズ付けを必要とする。
これにより、非プライベートトレーニングと比較してモデルユーティリティが削減される。
SmoothNetと呼ばれる新しいモデルアーキテクチャを蒸留し,DP-SGDトレーニングの課題に対するロバスト性の向上を特徴とした。
論文 参考訳(メタデータ) (2022-05-09T07:51:54Z) - Revisiting Batch Normalization for Improving Corruption Robustness [85.20742045853738]
モデルロバスト性を改善するために, モデルロバスト性を改善するために, バッチ正規化統計の修正を提案する。
モデルを再トレーニングすることなく、BN統計をいくつかの表現サンプル上で単純に推定し、適応させることで、大きなマージンによる腐敗の堅牢性を向上させることが判明した。
論文 参考訳(メタデータ) (2020-10-07T19:56:47Z) - Perceptually Optimizing Deep Image Compression [53.705543593594285]
平均二乗誤差(MSE)と$ell_p$ノルムは、ニューラルネットワークの損失の測定で大きく支配されている。
本稿では,定量的知覚モデルに対して,画像解析ネットワークを最適化するための異なるプロキシ手法を提案する。
論文 参考訳(メタデータ) (2020-07-03T14:33:28Z) - Improving robustness against common corruptions by covariate shift
adaptation [29.27289096759534]
最先端のマシンビジョンモデルは、ぼやけや圧縮アーチファクトといったイメージの破損に対して脆弱である。
一般的な汚職に対するモデル堅牢性を測定するための一般的なベンチマークは、多くの(すべてではないが)アプリケーションシナリオでモデル堅牢性を過小評価している、と我々は主張する。
論文 参考訳(メタデータ) (2020-06-30T17:01:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。