論文の概要: Evaluation and Comparison of Deep Learning Methods for Pavement Crack
Identification with Visual Images
- arxiv url: http://arxiv.org/abs/2112.10390v1
- Date: Mon, 20 Dec 2021 08:23:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-21 15:22:51.679485
- Title: Evaluation and Comparison of Deep Learning Methods for Pavement Crack
Identification with Visual Images
- Title(参考訳): 視覚画像を用いた舗装き裂同定のための深層学習手法の評価と比較
- Authors: Kai-Liang Lu
- Abstract要約: ディープラーニングアルゴリズムによる視覚画像による舗装き裂の識別は、検出対象の材料によって制限されないという利点がある。
パッチサンプル分類の面では、細調整されたTLモデルはEDモデルと精度で同等またはわずかに良い。
正確なクラック位置の面では、EDアルゴリズムとGANアルゴリズムの両方がピクセルレベルのセグメンテーションを達成でき、低演算パワープラットフォーム上でリアルタイムに検出されることが期待できる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Compared with contact detection techniques, pavement crack identification
with visual images via deep learning algorithms has the advantages of not being
limited by the material of object to be detected, fast speed and low cost. The
fundamental frameworks and typical model architectures of transfer learning
(TL), encoder-decoder (ED), generative adversarial networks (GAN), and their
common modules were first reviewed, and then the evolution of convolutional
neural network (CNN) backbone models and GAN models were summarized. The crack
classification, segmentation performance, and effect were tested on the
SDNET2018 and CFD public data sets. In the aspect of patch sample
classification, the fine-tuned TL models can be equivalent to or even slightly
better than the ED models in accuracy, and the predicting time is faster; In
the aspect of accurate crack location, both ED and GAN algorithms can achieve
pixel-level segmentation and is expected to be detected in real time on low
computing power platform. Furthermore, a weakly supervised learning framework
of combined TL-SSGAN and its performance enhancement measures are proposed,
which can maintain comparable crack identification performance with that of the
supervised learning, while greatly reducing the number of labeled samples
required.
- Abstract(参考訳): 接触検出技術と比較して、深層学習アルゴリズムによる視覚画像に対する舗装き裂識別は、検出対象の材料によって制限されないという利点があり、高速かつ低コストである。
トランスファーラーニング(TL)、エンコーダデコーダ(ED)、ジェネレーティブ・ディバーサリアル・ネットワーク(GAN)およびそれらの共通モジュールの基本的フレームワークと典型的なモデルアーキテクチャをまずレビューし、その後、畳み込みニューラルネットワーク(CNN)のバックボーンモデルとGANモデルの進化を要約した。
クラック分類、セグメンテーション性能および効果は、SDNET2018とCFDの公開データセットで試験された。
パッチサンプル分類の面では、細調整されたTLモデルはEDモデルよりも精度が若干良く、予測時間が速く、正確なクラック位置では、EDアルゴリズムとGANアルゴリズムの両方がピクセルレベルのセグメンテーションを達成でき、低演算パワープラットフォーム上でリアルタイムに検出されることが期待できる。
さらに,tl-ssganを併用した弱い教師付き学習フレームワークとその性能向上手法を提案し,教師付き学習と同等の亀裂識別性能を維持しつつ,必要なラベル付きサンプル数を大幅に削減した。
関連論文リスト
- DA-Flow: Dual Attention Normalizing Flow for Skeleton-based Video Anomaly Detection [52.74152717667157]
本稿では,DAM(Dual Attention Module)と呼ばれる軽量モジュールを提案する。
フレームアテンション機構を使用して、最も重要なフレームを識別し、スケルトンアテンション機構を使用して、最小パラメータとフロップで固定されたパーティション間の広範な関係をキャプチャする。
論文 参考訳(メタデータ) (2024-06-05T06:18:03Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Energy-based Out-of-Distribution Detection for Graph Neural Networks [76.0242218180483]
我々は,GNNSafeと呼ばれるグラフ上での学習のための,シンプルで強力で効率的なOOD検出モデルを提案する。
GNNSafeは、最先端技術に対するAUROCの改善を最大17.0%で達成しており、そのような未開発領域では単純だが強力なベースラインとして機能する可能性がある。
論文 参考訳(メタデータ) (2023-02-06T16:38:43Z) - Hybridization of Capsule and LSTM Networks for unsupervised anomaly
detection on multivariate data [0.0]
本稿では,Long-Short-Term-Memory(LSTM)とCapsule Networksを1つのネットワークに結合した新しいNNアーキテクチャを提案する。
提案手法は教師なし学習手法を用いて大量のラベル付きトレーニングデータを見つける際の問題を克服する。
論文 参考訳(メタデータ) (2022-02-11T10:33:53Z) - Cross-modal Knowledge Distillation for Vision-to-Sensor Action
Recognition [12.682984063354748]
本研究では、VSKDフレームワークをエンドツーエンドで導入する。
このVSKDフレームワークでは、テストフェーズ中にウェアラブルデバイスから必要となるのは時系列データ(加速度計データ)のみである。
このフレームワークは、エッジデバイスに対する計算要求を減らすだけでなく、計算コストのかかるマルチモーダルアプローチのパフォーマンスと密に一致した学習モデルも生成する。
論文 参考訳(メタデータ) (2021-10-08T15:06:38Z) - Robust Pooling through the Data Mode [5.7564383437854625]
本稿では,新しいロバストなプール層を含む新しいディープラーニングソリューションを提案する。
提案するプール層では,クラスタがモデルを示すため,RANSACとヒストグラムという2つの手法を用いて,モデム/クラスタのデータを探す。
我々は、プーリング層をポイントベースやグラフベースニューラルネットワークなどのフレームワークでテストし、ロバスト・オブ・ザ・アーティカルな手法と比較して、ロバストなロバスト性を示した。
論文 参考訳(メタデータ) (2021-06-21T04:35:24Z) - Automatic Visual Inspection of Rare Defects: A Framework based on
GP-WGAN and Enhanced Faster R-CNN [0.0]
本稿では,自動視覚検査(AVI)システムの2段階故障診断フレームワークを提案する。
第1段階では、実サンプルに基づいて新しいサンプルを合成する生成モデルが設計されている。
提案アルゴリズムは,実際のサンプルからオブジェクトを抽出し,ランダムにブレンドし,新しいサンプルを生成し,画像処理の性能を向上させる。
論文 参考訳(メタデータ) (2021-05-02T11:34:59Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Firearm Detection via Convolutional Neural Networks: Comparing a
Semantic Segmentation Model Against End-to-End Solutions [68.8204255655161]
武器の脅威検出とライブビデオからの攻撃的な行動は、潜在的に致命的な事故の迅速検出と予防に使用できる。
これを実現する一つの方法は、人工知能と、特に画像分析のための機械学習を使用することです。
従来のモノリシックなエンド・ツー・エンドのディープラーニングモデルと、セマンティクスセグメンテーションによって火花を検知する単純なニューラルネットワークのアンサンブルに基づく前述したモデルを比較した。
論文 参考訳(メタデータ) (2020-12-17T15:19:29Z) - Sparse Signal Models for Data Augmentation in Deep Learning ATR [0.8999056386710496]
ドメイン知識を取り入れ,データ集約学習アルゴリズムの一般化能力を向上させるためのデータ拡張手法を提案する。
本研究では,空間領域における散乱中心のスパース性とアジムタル領域における散乱係数の滑らかな変動構造を活かし,過パラメータモデルフィッティングの問題を解く。
論文 参考訳(メタデータ) (2020-12-16T21:46:33Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。