論文の概要: HrSegNet : Real-time High-Resolution Neural Network with Semantic
Guidance for Crack Segmentation
- arxiv url: http://arxiv.org/abs/2307.00270v1
- Date: Sat, 1 Jul 2023 08:38:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-05 17:03:55.024831
- Title: HrSegNet : Real-time High-Resolution Neural Network with Semantic
Guidance for Crack Segmentation
- Title(参考訳): HrSegNet : クラックセグメンテーションのための意味誘導型リアルタイム高分解能ニューラルネットワーク
- Authors: Yongshang Li, Ronggui Ma, Han Liu and Gaoli Cheng
- Abstract要約: 本稿では, リアルタイムひび割れ分割に特化して設計されたセマンティックガイダンスを用いた高分解能モデルを提案する。
本モデルは,低解像度特徴から高解像度特徴への回復とは対照的に,プロセス全体を通して高解像度を維持している。
文脈情報を強化するために,高解像度な特徴の再構築を導くために,低解像度のセマンティックな特徴を用いる。
- 参考スコア(独自算出の注目度): 6.1757304574413245
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Through extensive research on deep learning in recent years and its
application in construction, crack detection has evolved rapidly from rough
detection at the image-level and patch-level to fine-grained detection at the
pixel-level, which better suits the nature of this field. Despite numerous
existing studies utilizing off-the-shelf deep learning models or enhancing
them, these models are not always effective or efficient in real-world
applications. In order to bridge this gap, we propose a High-resolution model
with Semantic guidance, specifically designed for real-time crack segmentation,
referred to as HrSegNet. Our model maintains high resolution throughout the
entire process, as opposed to recovering from low-resolution features to
high-resolution ones, thereby maximizing the preservation of crack details.
Moreover, to enhance the context information, we use low-resolution semantic
features to guide the reconstruction of high-resolution features. To ensure the
efficiency of the algorithm, we design a simple yet effective method to control
the computation cost of the entire model by controlling the capacity of
high-resolution channels, while providing the model with extremely strong
scalability. Extensive quantitative and qualitative evaluations demonstrate
that our proposed HrSegNet has exceptional crack segmentation capabilities, and
that maintaining high resolution and semantic guidance are crucial to the final
prediction. Compared to state-of-the-art segmentation models, HrSegNet achieves
the best trade-off between efficiency and effectiveness. Specifically, on the
crack dataset CrackSeg9k, our fastest model HrSegNet-B16 achieves a speed of
182 FPS with 78.43% mIoU, while our most accurate model HrSegNet-B48 achieves
80.32% mIoU with an inference speed of 140.3 FPS.
- Abstract(参考訳): 近年のディープラーニングの広範な研究とその建設への応用を通じて、クラック検出は画像レベルの粗い検出とパッチレベルからピクセルレベルでのきめ細かい検出へと急速に進化し、この分野の性質に合致している。
既成のディープラーニングモデルを利用したり、強化したりする研究は数多くあるが、現実のアプリケーションでは、これらのモデルは必ずしも効果的でも効率的でもない。
このギャップを埋めるために,HrSegNetと呼ばれるリアルタイムき裂分割のためのセマンティックガイダンスを用いた高分解能モデルを提案する。
本モデルは,高分解能特徴から高分解能特徴への回復とは対照的に,プロセス全体を通して高分解能を維持し,ひび割れの保存を最大化する。
さらに、文脈情報を強化するために、高解像度特徴の再構築を導くために、低解像度意味特徴を用いる。
アルゴリズムの効率性を確保するため,高分解能チャネルの容量を制御し,モデル全体の計算コストを極めて高いスケーラビリティで制御する簡易かつ効率的な手法を設計する。
大規模定量的および定性的な評価により,提案するHrSegNetは例外的なひび割れセグメンテーション能力を有し,高分解能とセマンティックガイダンスの維持が最終予測に不可欠であることが示された。
最先端セグメンテーションモデルと比較して、HrSegNetは効率と有効性の間の最良のトレードオフを達成する。
具体的には、クラックデータセットCrackSeg9kにおいて、我々の最速モデルHrSegNet-B16は78.43% mIoUで182 FPS、最も正確なモデルHrSegNet-B48は140.32% mIoU、推論速度は140.3 FPSである。
関連論文リスト
- Revisiting Generative Adversarial Networks for Binary Semantic
Segmentation on Imbalanced Datasets [20.538287907723713]
異常き裂領域検出は典型的なバイナリセマンティックセグメンテーションタスクであり、アルゴリズムによって舗装面画像上のひび割れを表す画素を自動的に検出することを目的としている。
既存のディープラーニングベースの手法は、特定の公共舗装のデータセットで優れた結果を得たが、不均衡なデータセットでは性能が劇的に低下する。
画素レベルの異常き裂領域検出タスクに対して,条件付き生成逆ネットワーク(cGAN)に基づくディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-03T19:24:40Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Learning to Generate Training Datasets for Robust Semantic Segmentation [37.9308918593436]
セマンティックセグメンテーション手法の堅牢性を改善するための新しい手法を提案する。
我々は,現実的で可視な摂動画像を生成するために,新しい条件付き生成対向ネットワークであるRobustaを設計した。
我々の結果は、このアプローチが安全クリティカルなアプリケーションに有用である可能性を示唆している。
論文 参考訳(メタデータ) (2023-08-01T10:02:26Z) - Dual flow fusion model for concrete surface crack segmentation [0.0]
亀裂やその他の損傷は交通インフラの安全運用に重大な脅威をもたらす。
ディープラーニングモデルは、実用的な視覚的セグメンテーションタスクに広く応用されている。
本稿では,二重ストリームの融合に基づくひび割れ分割モデルを提案する。
論文 参考訳(メタデータ) (2023-05-09T02:35:58Z) - A Threefold Review on Deep Semantic Segmentation: Efficiency-oriented,
Temporal and Depth-aware design [77.34726150561087]
我々は、自動運転車のビジョンの文脈において、Deep Semanticの最も関連性があり最近の進歩について調査を行う。
私たちの主な目的は、それぞれの視点で直面している主要な方法、利点、制限、結果、課題に関する包括的な議論を提供することです。
論文 参考訳(メタデータ) (2023-03-08T01:29:55Z) - Learning-Based Defect Recognitions for Autonomous UAV Inspections [1.713291434132985]
我々は,Alexnet,VGG,Resnetなどの古典的ネットワークアーキテクチャに基づくひび割れ検出のためのディープラーニングフレームワークを実装した。
特徴ピラミッドネットワークアーキテクチャにヒントを得て、階層的畳み込みニューラルネットワーク(CNN)ディープラーニングフレームワークも提案されている。
また, 各種コンクリート構造物のひび割れ検査作業のために, 無人航空機の自動点検のための枠組みも提案する。
論文 参考訳(メタデータ) (2023-02-13T04:25:05Z) - Evaluation and Comparison of Deep Learning Methods for Pavement Crack
Identification with Visual Images [0.0]
ディープラーニングアルゴリズムによる視覚画像による舗装き裂の識別は、検出対象の材料によって制限されないという利点がある。
パッチサンプル分類の面では、細調整されたTLモデルはEDモデルと精度で同等またはわずかに良い。
正確なクラック位置の面では、EDアルゴリズムとGANアルゴリズムの両方がピクセルレベルのセグメンテーションを達成でき、低演算パワープラットフォーム上でリアルタイムに検出されることが期待できる。
論文 参考訳(メタデータ) (2021-12-20T08:23:43Z) - Coherent Loss: A Generic Framework for Stable Video Segmentation [103.78087255807482]
ビデオセグメンテーションの結果の視覚的品質を,ジッタリングアーティファクトがいかに劣化させるかを検討する。
本稿では,ニューラルネットワークの性能向上を目的とした汎用フレームワークを備えたコヒーレントロスを提案する。
論文 参考訳(メタデータ) (2020-10-25T10:48:28Z) - Real-time Semantic Segmentation with Fast Attention [94.88466483540692]
本稿では,高解像度画像と映像をリアルタイムにセマンティックセグメンテーションするための新しいアーキテクチャを提案する。
提案したアーキテクチャは我々の空間的注意の速さに依存しており、これは一般的な自己注意機構の単純かつ効率的な修正である。
複数のデータセットに対する結果から,既存の手法に比べて精度と速度が向上し,優れた性能を示した。
論文 参考訳(メタデータ) (2020-07-07T22:37:16Z) - Real-Time High-Performance Semantic Image Segmentation of Urban Street
Scenes [98.65457534223539]
都市景観のロバストなセマンティックセマンティックセグメンテーションのためのリアルタイムDCNNに基づく高速DCNN手法を提案する。
提案手法は, 51.0 fps と 39.3 fps の推論速度で, 平均 73.6% と平均 68.0% (mIoU) の精度を実現する。
論文 参考訳(メタデータ) (2020-03-11T08:45:53Z) - Depthwise Non-local Module for Fast Salient Object Detection Using a
Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。
提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文 参考訳(メタデータ) (2020-01-22T15:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。