論文の概要: Staircase Cascaded Fusion of Lightweight Local Pattern Recognition and Long-Range Dependencies for Structural Crack Segmentation
- arxiv url: http://arxiv.org/abs/2408.12815v2
- Date: Wed, 9 Oct 2024 07:58:37 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-08 05:37:29.187200
- Title: Staircase Cascaded Fusion of Lightweight Local Pattern Recognition and Long-Range Dependencies for Structural Crack Segmentation
- Title(参考訳): 軽量局所パターン認識のステアケースカスケード融合と構造き裂の長期依存性
- Authors: Hui Liu, Chen Jia, Fan Shi, Xu Cheng, Mianzhao Wang, Shengyong Chen,
- Abstract要約: 本稿では,最小限の計算資源を用いて高品質な亀裂分節マップを生成する階段型亀裂分節ネットワーク(CrackSCF)を提案する。
そこで我々は,局所的な亀裂パターンと画素の長距離依存性を効果的に捉えた階段列融合モジュールを構築した。
モデルが必要とする計算資源を削減するため,ネットワーク内のすべての畳み込み操作を置き換える軽量な畳み込みブロックを導入した。
- 参考スコア(独自算出の注目度): 28.157401919910914
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Detecting cracks with pixel-level precision for key structures is a significant challenge, as existing methods struggle to effectively integrate local textures and pixel dependencies of cracks. Furthermore, these methods often possess numerous parameters and substantial computational requirements, complicating deployment on edge control devices. In this paper, we propose a staircase cascaded fusion crack segmentation network (CrackSCF) that generates high-quality crack segmentation maps using minimal computational resources. We constructed a staircase cascaded fusion module that effectively captures local patterns of cracks and long-range dependencies of pixels, and it can suppress background noise well. To reduce the computational resources required by the model, we introduced a lightweight convolution block, which replaces all convolution operations in the network, significantly reducing the required computation and parameters without affecting the network's performance. To evaluate our method, we created a challenging benchmark dataset called TUT and conducted experiments on this dataset and five other public datasets. The experimental results indicate that our method offers significant advantages over existing methods, especially in handling background noise interference and detailed crack segmentation. The F1 and mIoU scores on the TUT dataset are 0.8382 and 0.8473, respectively, achieving state-of-the-art (SOTA) performance while requiring the least computational resources. The code and dataset is available at https://github.com/Karl1109/CrackSCF.
- Abstract(参考訳): クラックの局所的なテクスチャと画素依存性を効果的に統合する既存の手法では、キー構造に対する画素レベルの精度でクラックを検出することが大きな課題である。
さらに、これらの手法は、エッジ制御デバイスへの展開を複雑にし、多くのパラメータと相当な計算要求を持つことが多い。
本稿では,最小限の計算資源を用いて高品質な亀裂分割マップを生成する階段型亀裂分割ネットワーク(CrackSCF)を提案する。
我々は,局所的な亀裂パターンや画素の長距離依存性を効果的に捉え,背景雑音を効果的に抑制できる階段列融合モジュールを構築した。
モデルが必要とする計算資源を削減するために,ネットワーク内のすべての畳み込み操作を置き換える軽量畳み込みブロックを導入し,ネットワークの性能に影響を与えることなく,必要な計算とパラメータを著しく削減した。
この手法を評価するために、TUTと呼ばれる挑戦的なベンチマークデータセットを作成し、このデータセットと他の5つの公開データセットについて実験を行った。
実験結果から,本手法は既存の手法に比べて,特に背景雑音の干渉やき裂の詳細なセグメンテーションの処理において有益であることがわかった。
TUTデータセット上のF1とmIoUスコアはそれぞれ0.8382と0.8473であり、最小の計算資源を必要としながら最先端(SOTA)のパフォーマンスを達成する。
コードとデータセットはhttps://github.com/Karl1109/CrackSCFで公開されている。
関連論文リスト
- Deep Learning-Based Fatigue Cracks Detection in Bridge Girders using Feature Pyramid Networks [8.59780173800845]
本研究では,橋梁の鋼箱桁のひび割れ情報を含む高分解能画像からの自動き裂分割手法を提案する。
亀裂のマルチスケールの特徴を考慮し, 亀裂検出のための特徴ピラミッドネットワーク(FPN)の畳み込みニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-10-28T16:16:15Z) - EfficientCrackNet: A Lightweight Model for Crack Segmentation [1.3689715712707347]
き裂検出は、建物、舗装、橋の構造的整合性を維持するために不可欠である。
既存の軽量な手法は、計算の非効率性、複雑な亀裂パターン、難易度などの課題に直面していることが多い。
本稿では,CNN(Convolutional Neural Networks)とトランスフォーマーを組み合わせた軽量ハイブリッドモデルであるEfficientCrackNetを提案する。
論文 参考訳(メタデータ) (2024-09-26T17:44:20Z) - Hybrid-Segmentor: A Hybrid Approach to Automated Fine-Grained Crack Segmentation in Civil Infrastructure [52.2025114590481]
エンコーダ・デコーダをベースとした手法であるHybrid-Segmentorを導入する。
これにより、モデルは、様々な種類の形状、表面、き裂の大きさを区別する一般化能力を向上させることができる。
提案モデルは,5つの測定基準(精度0.971,精度0.804,リコール0.744,F1スコア0.770,IoUスコア0.630)で既存ベンチマークモデルより優れ,最先端の状態を達成している。
論文 参考訳(メタデータ) (2024-09-04T16:47:16Z) - Simple Ingredients for Offline Reinforcement Learning [86.1988266277766]
オフライン強化学習アルゴリズムは、ターゲット下流タスクに高度に接続されたデータセットに有効であることが証明された。
既存の手法が多様なデータと競合することを示す。その性能は、関連するデータ収集によって著しく悪化するが、オフラインバッファに異なるタスクを追加するだけでよい。
アルゴリズム的な考慮以上のスケールが、パフォーマンスに影響を及ぼす重要な要因であることを示す。
論文 参考訳(メタデータ) (2024-03-19T18:57:53Z) - Revisiting Generative Adversarial Networks for Binary Semantic
Segmentation on Imbalanced Datasets [20.538287907723713]
異常き裂領域検出は典型的なバイナリセマンティックセグメンテーションタスクであり、アルゴリズムによって舗装面画像上のひび割れを表す画素を自動的に検出することを目的としている。
既存のディープラーニングベースの手法は、特定の公共舗装のデータセットで優れた結果を得たが、不均衡なデータセットでは性能が劇的に低下する。
画素レベルの異常き裂領域検出タスクに対して,条件付き生成逆ネットワーク(cGAN)に基づくディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-03T19:24:40Z) - Depth-agnostic Single Image Dehazing [12.51359372069387]
本研究では, 深度に依存しないデータセット(DA-HAZE)を生成することで, ヘイズ密度とシーン深度の関係を分離する, 単純かつ斬新な合成法を提案する。
実験によると、DA-HAZEでトレーニングされたモデルは、SOTSとDA-SOTSの相違が少なく、実世界のベンチマークで大幅に改善されている。
我々は、専用に設計されたブロックが組み込まれているデハジングのために、U-Netベースのアーキテクチャを再考する。
論文 参考訳(メタデータ) (2024-01-14T06:33:11Z) - Transforming Image Super-Resolution: A ConvFormer-based Efficient Approach [58.57026686186709]
本稿では, Convolutional Transformer Layer (ConvFormer) を導入し, ConvFormer-based Super-Resolution Network (CFSR) を提案する。
CFSRは畳み込みベースのアプローチとトランスフォーマーベースのアプローチの両方の利点を継承する。
CFSRは計算コストと性能のバランスが最適であることを示す実験である。
論文 参考訳(メタデータ) (2024-01-11T03:08:00Z) - Real-Time Scene Text Detection with Differentiable Binarization and
Adaptive Scale Fusion [62.269219152425556]
セグメンテーションに基づくシーンテキスト検出手法はシーンテキスト検出分野において大きな注目を集めている。
本稿では,二項化処理をセグメンテーションネットワークに統合する分散二項化(DB)モジュールを提案する。
アダプティブ・スケール・フュージョン (ASF) モジュールは, 異なるスケールの特徴を適応的に融合させることにより, スケールのロバスト性を向上させる。
論文 参考訳(メタデータ) (2022-02-21T15:30:14Z) - Efficient Micro-Structured Weight Unification and Pruning for Neural
Network Compression [56.83861738731913]
ディープニューラルネットワーク(DNN)モデルは、特にリソース制限されたデバイスにおいて、実用的なアプリケーションに不可欠である。
既往の非構造的あるいは構造化された重量刈り法は、推論を真に加速することはほとんど不可能である。
ハードウェア互換のマイクロ構造レベルでの一般化された重み統一フレームワークを提案し,高い圧縮と加速度を実現する。
論文 参考訳(メタデータ) (2021-06-15T17:22:59Z) - Structured Convolutions for Efficient Neural Network Design [65.36569572213027]
畳み込みニューラルネットワーク構築ブロックのテクスト単純構造における冗長性を利用してモデル効率に取り組む。
この分解が2Dカーネルや3Dカーネルだけでなく、完全に接続されたレイヤにも適用可能であることを示す。
論文 参考訳(メタデータ) (2020-08-06T04:38:38Z) - FarSee-Net: Real-Time Semantic Segmentation by Efficient Multi-scale
Context Aggregation and Feature Space Super-resolution [14.226301825772174]
Cascaded Factorized Atrous Space Pyramid Pooling (CF-ASPP) と呼ばれる新しい効率的なモジュールについて紹介する。
これは畳み込みニューラルネットワーク(CNN)のための軽量なカスケード構造であり、コンテキスト情報を効率的に活用する。
我々は1枚のNivida Titan X (Maxwell) GPUカードでCityscapesテストセットの84fpsで68.4% mIoUを達成した。
論文 参考訳(メタデータ) (2020-03-09T03:53:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。