論文の概要: HrSegNet : Real-time High-Resolution Neural Network with Semantic
Guidance for Crack Segmentation
- arxiv url: http://arxiv.org/abs/2307.00270v1
- Date: Sat, 1 Jul 2023 08:38:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-05 17:03:55.024831
- Title: HrSegNet : Real-time High-Resolution Neural Network with Semantic
Guidance for Crack Segmentation
- Title(参考訳): HrSegNet : クラックセグメンテーションのための意味誘導型リアルタイム高分解能ニューラルネットワーク
- Authors: Yongshang Li, Ronggui Ma, Han Liu and Gaoli Cheng
- Abstract要約: 本稿では, リアルタイムひび割れ分割に特化して設計されたセマンティックガイダンスを用いた高分解能モデルを提案する。
本モデルは,低解像度特徴から高解像度特徴への回復とは対照的に,プロセス全体を通して高解像度を維持している。
文脈情報を強化するために,高解像度な特徴の再構築を導くために,低解像度のセマンティックな特徴を用いる。
- 参考スコア(独自算出の注目度): 6.1757304574413245
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Through extensive research on deep learning in recent years and its
application in construction, crack detection has evolved rapidly from rough
detection at the image-level and patch-level to fine-grained detection at the
pixel-level, which better suits the nature of this field. Despite numerous
existing studies utilizing off-the-shelf deep learning models or enhancing
them, these models are not always effective or efficient in real-world
applications. In order to bridge this gap, we propose a High-resolution model
with Semantic guidance, specifically designed for real-time crack segmentation,
referred to as HrSegNet. Our model maintains high resolution throughout the
entire process, as opposed to recovering from low-resolution features to
high-resolution ones, thereby maximizing the preservation of crack details.
Moreover, to enhance the context information, we use low-resolution semantic
features to guide the reconstruction of high-resolution features. To ensure the
efficiency of the algorithm, we design a simple yet effective method to control
the computation cost of the entire model by controlling the capacity of
high-resolution channels, while providing the model with extremely strong
scalability. Extensive quantitative and qualitative evaluations demonstrate
that our proposed HrSegNet has exceptional crack segmentation capabilities, and
that maintaining high resolution and semantic guidance are crucial to the final
prediction. Compared to state-of-the-art segmentation models, HrSegNet achieves
the best trade-off between efficiency and effectiveness. Specifically, on the
crack dataset CrackSeg9k, our fastest model HrSegNet-B16 achieves a speed of
182 FPS with 78.43% mIoU, while our most accurate model HrSegNet-B48 achieves
80.32% mIoU with an inference speed of 140.3 FPS.
- Abstract(参考訳): 近年のディープラーニングの広範な研究とその建設への応用を通じて、クラック検出は画像レベルの粗い検出とパッチレベルからピクセルレベルでのきめ細かい検出へと急速に進化し、この分野の性質に合致している。
既成のディープラーニングモデルを利用したり、強化したりする研究は数多くあるが、現実のアプリケーションでは、これらのモデルは必ずしも効果的でも効率的でもない。
このギャップを埋めるために,HrSegNetと呼ばれるリアルタイムき裂分割のためのセマンティックガイダンスを用いた高分解能モデルを提案する。
本モデルは,高分解能特徴から高分解能特徴への回復とは対照的に,プロセス全体を通して高分解能を維持し,ひび割れの保存を最大化する。
さらに、文脈情報を強化するために、高解像度特徴の再構築を導くために、低解像度意味特徴を用いる。
アルゴリズムの効率性を確保するため,高分解能チャネルの容量を制御し,モデル全体の計算コストを極めて高いスケーラビリティで制御する簡易かつ効率的な手法を設計する。
大規模定量的および定性的な評価により,提案するHrSegNetは例外的なひび割れセグメンテーション能力を有し,高分解能とセマンティックガイダンスの維持が最終予測に不可欠であることが示された。
最先端セグメンテーションモデルと比較して、HrSegNetは効率と有効性の間の最良のトレードオフを達成する。
具体的には、クラックデータセットCrackSeg9kにおいて、我々の最速モデルHrSegNet-B16は78.43% mIoUで182 FPS、最も正確なモデルHrSegNet-B48は140.32% mIoU、推論速度は140.3 FPSである。
関連論文リスト
- EfficientCrackNet: A Lightweight Model for Crack Segmentation [1.3689715712707347]
き裂検出は、建物、舗装、橋の構造的整合性を維持するために不可欠である。
既存の軽量な手法は、計算の非効率性、複雑な亀裂パターン、難易度などの課題に直面していることが多い。
本稿では,CNN(Convolutional Neural Networks)とトランスフォーマーを組み合わせた軽量ハイブリッドモデルであるEfficientCrackNetを提案する。
論文 参考訳(メタデータ) (2024-09-26T17:44:20Z) - Hybrid-Segmentor: A Hybrid Approach to Automated Fine-Grained Crack Segmentation in Civil Infrastructure [52.2025114590481]
エンコーダ・デコーダをベースとした手法であるHybrid-Segmentorを導入する。
これにより、モデルは、様々な種類の形状、表面、き裂の大きさを区別する一般化能力を向上させることができる。
提案モデルは,5つの測定基準(精度0.971,精度0.804,リコール0.744,F1スコア0.770,IoUスコア0.630)で既存ベンチマークモデルより優れ,最先端の状態を達成している。
論文 参考訳(メタデータ) (2024-09-04T16:47:16Z) - Staircase Cascaded Fusion of Lightweight Local Pattern Recognition and Long-Range Dependencies for Structural Crack Segmentation [28.157401919910914]
本稿では,最小限の計算資源を用いて高品質な亀裂分節マップを生成する階段型亀裂分節ネットワーク(CrackSCF)を提案する。
そこで我々は,局所的な亀裂パターンと画素の長距離依存性を効果的に捉えた階段列融合モジュールを構築した。
モデルが必要とする計算資源を削減するため,ネットワーク内のすべての畳み込み操作を置き換える軽量な畳み込みブロックを導入した。
論文 参考訳(メタデータ) (2024-08-23T03:21:51Z) - Revisiting Generative Adversarial Networks for Binary Semantic
Segmentation on Imbalanced Datasets [20.538287907723713]
異常き裂領域検出は典型的なバイナリセマンティックセグメンテーションタスクであり、アルゴリズムによって舗装面画像上のひび割れを表す画素を自動的に検出することを目的としている。
既存のディープラーニングベースの手法は、特定の公共舗装のデータセットで優れた結果を得たが、不均衡なデータセットでは性能が劇的に低下する。
画素レベルの異常き裂領域検出タスクに対して,条件付き生成逆ネットワーク(cGAN)に基づくディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-03T19:24:40Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - A Threefold Review on Deep Semantic Segmentation: Efficiency-oriented,
Temporal and Depth-aware design [77.34726150561087]
我々は、自動運転車のビジョンの文脈において、Deep Semanticの最も関連性があり最近の進歩について調査を行う。
私たちの主な目的は、それぞれの視点で直面している主要な方法、利点、制限、結果、課題に関する包括的な議論を提供することです。
論文 参考訳(メタデータ) (2023-03-08T01:29:55Z) - Learning-Based Defect Recognitions for Autonomous UAV Inspections [1.713291434132985]
我々は,Alexnet,VGG,Resnetなどの古典的ネットワークアーキテクチャに基づくひび割れ検出のためのディープラーニングフレームワークを実装した。
特徴ピラミッドネットワークアーキテクチャにヒントを得て、階層的畳み込みニューラルネットワーク(CNN)ディープラーニングフレームワークも提案されている。
また, 各種コンクリート構造物のひび割れ検査作業のために, 無人航空機の自動点検のための枠組みも提案する。
論文 参考訳(メタデータ) (2023-02-13T04:25:05Z) - Evaluation and Comparison of Deep Learning Methods for Pavement Crack
Identification with Visual Images [0.0]
ディープラーニングアルゴリズムによる視覚画像による舗装き裂の識別は、検出対象の材料によって制限されないという利点がある。
パッチサンプル分類の面では、細調整されたTLモデルはEDモデルと精度で同等またはわずかに良い。
正確なクラック位置の面では、EDアルゴリズムとGANアルゴリズムの両方がピクセルレベルのセグメンテーションを達成でき、低演算パワープラットフォーム上でリアルタイムに検出されることが期待できる。
論文 参考訳(メタデータ) (2021-12-20T08:23:43Z) - Real-time Semantic Segmentation with Fast Attention [94.88466483540692]
本稿では,高解像度画像と映像をリアルタイムにセマンティックセグメンテーションするための新しいアーキテクチャを提案する。
提案したアーキテクチャは我々の空間的注意の速さに依存しており、これは一般的な自己注意機構の単純かつ効率的な修正である。
複数のデータセットに対する結果から,既存の手法に比べて精度と速度が向上し,優れた性能を示した。
論文 参考訳(メタデータ) (2020-07-07T22:37:16Z) - Real-Time High-Performance Semantic Image Segmentation of Urban Street
Scenes [98.65457534223539]
都市景観のロバストなセマンティックセマンティックセグメンテーションのためのリアルタイムDCNNに基づく高速DCNN手法を提案する。
提案手法は, 51.0 fps と 39.3 fps の推論速度で, 平均 73.6% と平均 68.0% (mIoU) の精度を実現する。
論文 参考訳(メタデータ) (2020-03-11T08:45:53Z) - Depthwise Non-local Module for Fast Salient Object Detection Using a
Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。
提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文 参考訳(メタデータ) (2020-01-22T15:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。