論文の概要: Hierarchical Convolutional Neural Network with Feature Preservation and
Autotuned Thresholding for Crack Detection
- arxiv url: http://arxiv.org/abs/2104.10511v1
- Date: Wed, 21 Apr 2021 13:07:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-22 19:47:06.877860
- Title: Hierarchical Convolutional Neural Network with Feature Preservation and
Autotuned Thresholding for Crack Detection
- Title(参考訳): き裂検出のための特徴保存と自動閾値付き階層畳み込みニューラルネットワーク
- Authors: Qiuchen Zhu, Tran Hiep Dinh, Manh Duong Phung, Quang Phuc Ha
- Abstract要約: ドローンの画像はインフラ表面の欠陥の自動検査にますます使われている。
本稿では,階層型畳み込みニューラルネットワークを用いた深層学習手法を提案する。
提案手法は, 道路, 橋, 舗装の表面ひび割れの同定に応用されている。
- 参考スコア(独自算出の注目度): 5.735035463793008
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Drone imagery is increasingly used in automated inspection for infrastructure
surface defects, especially in hazardous or unreachable environments. In
machine vision, the key to crack detection rests with robust and accurate
algorithms for image processing. To this end, this paper proposes a deep
learning approach using hierarchical convolutional neural networks with feature
preservation (HCNNFP) and an intercontrast iterative thresholding algorithm for
image binarization. First, a set of branch networks is proposed, wherein the
output of previous convolutional blocks is half-sizedly concatenated to the
current ones to reduce the obscuration in the down-sampling stage taking into
account the overall information loss. Next, to extract the feature map
generated from the enhanced HCNN, a binary contrast-based autotuned
thresholding (CBAT) approach is developed at the post-processing step, where
patterns of interest are clustered within the probability map of the identified
features. The proposed technique is then applied to identify surface cracks on
the surface of roads, bridges or pavements. An extensive comparison with
existing techniques is conducted on various datasets and subject to a number of
evaluation criteria including the average F-measure (AF\b{eta}) introduced here
for dynamic quantification of the performance. Experiments on crack images,
including those captured by unmanned aerial vehicles inspecting a monorail
bridge. The proposed technique outperforms the existing methods on various
tested datasets especially for GAPs dataset with an increase of about 1.4% in
terms of AF\b{eta} while the mean percentage error drops by 2.2%. Such
performance demonstrates the merits of the proposed HCNNFP architecture for
surface defect inspection.
- Abstract(参考訳): ドローン画像は、特に危険または到達不能な環境で、インフラ表面の欠陥の自動検査にますます利用されている。
マシンビジョンでは、クラック検出の鍵は、画像処理のためのロバストで正確なアルゴリズムにある。
そこで本研究では,階層型畳み込みニューラルネットワーク(hcnnfp)と,画像2値化のためのコントラスト反復しきい値化アルゴリズムを用いたディープラーニング手法を提案する。
まず、従来の畳み込みブロックの出力を現在のブロックに半サイズ結合し、全体的な情報損失を考慮したダウンサンプリングステージの閉塞を低減する分岐ネットワークのセットを提案する。
次に、拡張HCNNから生成された特徴マップを抽出するために、特徴の確率マップ内に関心のパターンをクラスタ化する二項コントラストベース自動調整しきい値(CBAT)アプローチを後処理ステップで開発する。
提案手法は, 道路, 橋, 舗装の表面ひび割れの同定に応用されている。
各種データセットを用いて既存の手法との比較を行い, 性能の動的定量化のためのF値の平均値 (AF\b{eta}) を含む評価基準について検討した。
モノレール橋を検査する無人航空機によって撮影されたものを含む亀裂画像の実験。
提案手法は,特にGAPデータセットにおいて,AF\b{eta} で約1.4%増加し,平均誤差が2.2%減少するなど,既存の手法よりも優れている。
このような性能は表面欠陥検査において提案したHCNNFPアーキテクチャの利点を示す。
関連論文リスト
- Enhanced Wavelet Scattering Network for image inpainting detection [0.0]
本稿では,低レベル雑音解析に基づく塗装前駆体検出のための革新的なアイデアをいくつか提案する。
これはDual-Tree Complex Wavelet Transform (DT-CWT)と畳み込みニューラルネットワーク(CNN)を組み合わせて、偽エリア検出とローカライゼーションを実現している。
提案手法は最先端手法に対してベンチマークを行い,提案手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-09-25T15:27:05Z) - Revisiting Generative Adversarial Networks for Binary Semantic
Segmentation on Imbalanced Datasets [20.538287907723713]
異常き裂領域検出は典型的なバイナリセマンティックセグメンテーションタスクであり、アルゴリズムによって舗装面画像上のひび割れを表す画素を自動的に検出することを目的としている。
既存のディープラーニングベースの手法は、特定の公共舗装のデータセットで優れた結果を得たが、不均衡なデータセットでは性能が劇的に低下する。
画素レベルの異常き裂領域検出タスクに対して,条件付き生成逆ネットワーク(cGAN)に基づくディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-03T19:24:40Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - PRISTA-Net: Deep Iterative Shrinkage Thresholding Network for Coded
Diffraction Patterns Phase Retrieval [6.982256124089]
位相検索は、計算画像および画像処理における非線型逆問題である。
我々は,1次反復しきい値しきい値アルゴリズム(ISTA)に基づく深層展開ネットワークであるPRISTA-Netを開発した。
非線形変換,しきい値,ステップサイズなど,提案するPRISTA-Netフレームワークのパラメータはすべて,設定されるのではなく,エンドツーエンドで学習される。
論文 参考訳(メタデータ) (2023-09-08T07:37:15Z) - Enhanced Sharp-GAN For Histopathology Image Synthesis [63.845552349914186]
病理組織像合成は、正確ながん検出のためのディープラーニングアプローチの訓練において、データ不足の問題に対処することを目的としている。
核トポロジと輪郭正則化を用いて合成画像の品質を向上させる新しい手法を提案する。
提案手法は、Sharp-GANを2つのデータセット上の4つの画像品質指標すべてで上回る。
論文 参考訳(メタデータ) (2023-01-24T17:54:01Z) - One-Stage Deep Edge Detection Based on Dense-Scale Feature Fusion and
Pixel-Level Imbalance Learning [5.370848116287344]
後処理なしで高品質なエッジ画像を生成することができる一段階ニューラルネットワークモデルを提案する。
提案モデルでは、トレーニング済みのニューラルモデルをエンコーダとして使用する古典的なエンコーダデコーダフレームワークを採用している。
本稿では,エッジ画像の画素レベルの不均衡に対処する新たな損失関数を提案する。
論文 参考訳(メタデータ) (2022-03-17T15:26:00Z) - Generalizing Face Forgery Detection with High-frequency Features [63.33397573649408]
現在のCNNベースの検出器は、メソッド固有の色テクスチャに過度に適合するため、一般化に失敗する傾向にある。
フェースフォージェリ検出に高周波雑音を用いることを提案する。
1つは、複数のスケールで高周波ノイズを抽出するマルチスケールの高周波特徴抽出モジュールである。
2つ目は、低レベルRGB特徴抽出器を導く残差誘導空間注意モジュールで、新しい視点からフォージェリートレースにもっと集中する。
論文 参考訳(メタデータ) (2021-03-23T08:19:21Z) - Probabilistic Graph Attention Network with Conditional Kernels for
Pixel-Wise Prediction [158.88345945211185]
本稿では,画素レベルの予測を基本的側面,すなわち,技術の現状を推し進める新たなアプローチを提案する。
構造化されたマルチスケール機能学習と融合。
本論文では,マルチスケール表現を原理的に学習・融合するための新しいアテンテンションゲート条件ランダムフィールド(AG-CRFs)モデルに基づく確率的グラフアテンションネットワーク構造を提案する。
論文 参考訳(メタデータ) (2021-01-08T04:14:29Z) - Efficient detection of adversarial images [2.6249027950824506]
画像の画素値は外部攻撃者によって修正されるため、人間の目にはほとんど見えない。
本稿では,修正画像の検出を容易にする新しい前処理手法を提案する。
このアルゴリズムの適応バージョンでは、ランダムな数の摂動が適応的に選択される。
論文 参考訳(メタデータ) (2020-07-09T05:35:49Z) - UC-Net: Uncertainty Inspired RGB-D Saliency Detection via Conditional
Variational Autoencoders [81.5490760424213]
データラベリングプロセスから学習することで、RGB-Dサリエンシ検出に不確実性を利用するための第1のフレームワーク(UCNet)を提案する。
そこで本研究では,サリエンシデータラベリングにヒントを得て,確率的RGB-Dサリエンシ検出ネットワークを提案する。
論文 参考訳(メタデータ) (2020-04-13T04:12:59Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。