論文の概要: Pothole Detection and Recognition based on Transfer Learning
- arxiv url: http://arxiv.org/abs/2509.06750v1
- Date: Mon, 08 Sep 2025 14:40:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-09 14:07:04.193164
- Title: Pothole Detection and Recognition based on Transfer Learning
- Title(参考訳): 伝達学習に基づくポトホール検出と認識
- Authors: Mang Hu, Qianqian Xia,
- Abstract要約: 転送学習に基づく深層学習特徴抽出ネットワークResNet50-Net-RegNetモデルを構築した。
本モデルでは,認識速度と精度において,他のモデルよりも高い性能を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the rapid development of computer vision and machine learning, automated methods for pothole detection and recognition based on image and video data have received significant attention. It is of great significance for social development to conduct an in-depth analysis of road images through feature extraction, thereby achieving automatic identification of the pothole condition in new images. Consequently, this is the main issue addressed in this study. Based on preprocessing techniques such as standardization, normalization, and data augmentation applied to the collected raw dataset, we continuously improved the network model based on experimental results. Ultimately, we constructed a deep learning feature extraction network ResNet50-EfficientNet-RegNet model based on transfer learning. This model exhibits high classification accuracy and computational efficiency. In terms of model evaluation, this study employed a comparative evaluation approach by comparing the performance of the proposed transfer learning model with other models, including Random Forest, MLP, SVM, and LightGBM. The comparison analysis was conducted based on metrics such as Accuracy, Recall, Precision, F1-score, and FPS, to assess the classification performance of the transfer learning model proposed in this paper. The results demonstrate that our model exhibits high performance in terms of recognition speed and accuracy, surpassing the performance of other models. Through careful parameter selection and model optimization, our transfer learning model achieved a classification accuracy of 97.78% (88/90) on the initial set of 90 test samples and 98.89% (890/900) on the expanded test set.
- Abstract(参考訳): コンピュータビジョンと機械学習の急速な発展に伴い、画像とビデオデータに基づくポットホール検出と認識の自動化が注目されている。
道路画像の詳細な解析を特徴抽出を通じて行うことにより,新しい画像におけるポットホール条件の自動識別を実現することが,社会開発において非常に重要である。
その結果,本研究ではこの問題に対処した。
収集した生データセットに適用された標準化,正規化,データ拡張などの前処理技術に基づいて,実験結果に基づいてネットワークモデルを継続的に改善する。
最終的に、転送学習に基づく深層学習特徴抽出ネットワークResNet50-EfficientNet-RegNetモデルを構築した。
このモデルは高い分類精度と計算効率を示す。
モデル評価では,提案した移動学習モデルとRandom Forest, MLP, SVM, LightGBMなどのモデルを比較して比較評価を行った。
比較分析は, 精度, リコール, 精度, F1スコア, FPSなどの指標に基づいて行われ, 本論文で提案した伝達学習モデルの分類性能を評価する。
その結果,本モデルでは認識速度や精度が向上し,他のモデルよりも高い性能を示した。
パラメータ選択とモデル最適化により,90検体で97.78% (88/90) ,拡張検体で98.89% (890/900) の分類精度を得た。
関連論文リスト
- Self-Supervised Learning in Deep Networks: A Pathway to Robust Few-Shot Classification [0.0]
まず、ラベルのない大量のデータから共通特徴表現を学習できるように、自己スーパービジョンでモデルを事前訓練する。
その後、数ショットのデータセットMini-ImageNetで微調整を行い、限られたデータの下でモデルの精度と一般化能力を改善する。
論文 参考訳(メタデータ) (2024-11-19T01:01:56Z) - Predictive Analytics of Varieties of Potatoes [2.336821989135698]
本研究では, 育種試験におけるサツマイモクローンの選択プロセスの向上を目的とした, 機械学習アルゴリズムの適用について検討する。
本研究は, 高収率, 耐病性, 耐気候性ポテト品種を効率的に同定することの課題に対処する。
論文 参考訳(メタデータ) (2024-04-04T00:49:05Z) - Wafer Map Defect Patterns Semi-Supervised Classification Using Latent
Vector Representation [8.400553138721044]
集積回路製造段階における欠陥検出の需要はますます重要になりつつある。
従来のウェハマップ欠陥パターン検出法は、電子顕微鏡を用いた手動検査を含む。
手動操作の代わりに欠陥を自動的に検出できるモデルを提案する。
論文 参考訳(メタデータ) (2023-10-06T08:23:36Z) - The effectiveness of MAE pre-pretraining for billion-scale pretraining [65.98338857597935]
モデルの初期化には自己教師付きMAE技術を用いる。
画像分類, 映像認識, 物体検出, ローショット分類, ゼロショット認識にまたがる10種類の視覚的タスクに対して, 事前学習の有効性を評価する。
論文 参考訳(メタデータ) (2023-03-23T17:56:12Z) - Graph Neural Network based Child Activity Recognition [6.423239719448169]
本稿では,グラフ畳み込みネットワーク(GCN)に基づく深層学習モデルを用いた児童活動認識(CAR)の実装について述べる。
特徴抽出法と微調整法により、精度は20%-30%向上し、最高精度は82.24%となった。
論文 参考訳(メタデータ) (2022-12-18T05:07:11Z) - Revisiting Classifier: Transferring Vision-Language Models for Video
Recognition [102.93524173258487]
ダウンストリームタスクのためのタスク非依存の深層モデルから知識を伝達することは、コンピュータビジョン研究において重要なトピックである。
本研究では,映像分類作業における知識の伝達に着目した。
予測された言語モデルを用いて、効率的な翻訳学習のための適切なセマンティックターゲットを生成する。
論文 参考訳(メタデータ) (2022-07-04T10:00:47Z) - CONVIQT: Contrastive Video Quality Estimator [63.749184706461826]
知覚ビデオ品質評価(VQA)は、多くのストリーミングおよびビデオ共有プラットフォームにおいて不可欠な要素である。
本稿では,視覚的に関連のある映像品質表現を自己指導的に学習する問題について考察する。
本研究は, 自己教師型学習を用いて, 知覚力による説得力のある表現が得られることを示す。
論文 参考訳(メタデータ) (2022-06-29T15:22:01Z) - ALT-MAS: A Data-Efficient Framework for Active Testing of Machine
Learning Algorithms [58.684954492439424]
少量のラベル付きテストデータのみを用いて機械学習モデルを効率的にテストする新しいフレームワークを提案する。
ベイズニューラルネットワーク(bnn)を用いたモデルアンダーテストの関心指標の推定が目的である。
論文 参考訳(メタデータ) (2021-04-11T12:14:04Z) - Performance Evaluation of Convolutional Neural Networks for Gait
Recognition [0.0]
CNN(Convolutional Neural Networks)はCASIA-BデータセットのGait Energy Images (GEIs)を用いて再訓練された。
ほぼ全てのモデルは90%を超える高い精度を達成しており、クラスの増加に対して堅牢である。
論文 参考訳(メタデータ) (2021-01-25T14:44:05Z) - Models, Pixels, and Rewards: Evaluating Design Trade-offs in Visual
Model-Based Reinforcement Learning [109.74041512359476]
視覚的MBRLアルゴリズムにおける予測モデルの設計決定について検討する。
潜在空間の使用など、しばしば重要と見なされる設計上の決定は、タスクのパフォーマンスにはほとんど影響しないことが分かりました。
我々は,この現象が探索とどのように関係しているか,および標準ベンチマークにおける下位スコーリングモデルのいくつかが,同じトレーニングデータでトレーニングされた場合のベストパフォーマンスモデルと同等の性能を発揮するかを示す。
論文 参考訳(メタデータ) (2020-12-08T18:03:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。