Fugu-MT 論文翻訳(概要): Staircase Cascaded Fusion of Lightweight Local Pattern Recognition and Long-Range Dependencies for Structural Crack Segmentation

論文の概要: Staircase Cascaded Fusion of Lightweight Local Pattern Recognition and Long-Range Dependencies for Structural Crack Segmentation

arxiv url: http://arxiv.org/abs/2408.12815v2
Date: Wed, 9 Oct 2024 07:58:37 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-08 05:37:29.187200
Title: Staircase Cascaded Fusion of Lightweight Local Pattern Recognition and Long-Range Dependencies for Structural Crack Segmentation
Title（参考訳）: 軽量局所パターン認識のステアケースカスケード融合と構造き裂の長期依存性
Authors: Hui Liu, Chen Jia, Fan Shi, Xu Cheng, Mianzhao Wang, Shengyong Chen,
Abstract要約: 本稿では,最小限の計算資源を用いて高品質な亀裂分節マップを生成する階段型亀裂分節ネットワーク(CrackSCF)を提案する。そこで我々は,局所的な亀裂パターンと画素の長距離依存性を効果的に捉えた階段列融合モジュールを構築した。モデルが必要とする計算資源を削減するため,ネットワーク内のすべての畳み込み操作を置き換える軽量な畳み込みブロックを導入した。
参考スコア（独自算出の注目度）: 28.157401919910914
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Detecting cracks with pixel-level precision for key structures is a significant challenge, as existing methods struggle to effectively integrate local textures and pixel dependencies of cracks. Furthermore, these methods often possess numerous parameters and substantial computational requirements, complicating deployment on edge control devices. In this paper, we propose a staircase cascaded fusion crack segmentation network (CrackSCF) that generates high-quality crack segmentation maps using minimal computational resources. We constructed a staircase cascaded fusion module that effectively captures local patterns of cracks and long-range dependencies of pixels, and it can suppress background noise well. To reduce the computational resources required by the model, we introduced a lightweight convolution block, which replaces all convolution operations in the network, significantly reducing the required computation and parameters without affecting the network's performance. To evaluate our method, we created a challenging benchmark dataset called TUT and conducted experiments on this dataset and five other public datasets. The experimental results indicate that our method offers significant advantages over existing methods, especially in handling background noise interference and detailed crack segmentation. The F1 and mIoU scores on the TUT dataset are 0.8382 and 0.8473, respectively, achieving state-of-the-art (SOTA) performance while requiring the least computational resources. The code and dataset is available at https://github.com/Karl1109/CrackSCF.
Abstract（参考訳）: クラックの局所的なテクスチャと画素依存性を効果的に統合する既存の手法では、キー構造に対する画素レベルの精度でクラックを検出することが大きな課題である。さらに、これらの手法は、エッジ制御デバイスへの展開を複雑にし、多くのパラメータと相当な計算要求を持つことが多い。本稿では,最小限の計算資源を用いて高品質な亀裂分割マップを生成する階段型亀裂分割ネットワーク(CrackSCF)を提案する。我々は,局所的な亀裂パターンや画素の長距離依存性を効果的に捉え,背景雑音を効果的に抑制できる階段列融合モジュールを構築した。モデルが必要とする計算資源を削減するために,ネットワーク内のすべての畳み込み操作を置き換える軽量畳み込みブロックを導入し,ネットワークの性能に影響を与えることなく,必要な計算とパラメータを著しく削減した。この手法を評価するために、TUTと呼ばれる挑戦的なベンチマークデータセットを作成し、このデータセットと他の5つの公開データセットについて実験を行った。実験結果から,本手法は既存の手法に比べて,特に背景雑音の干渉やき裂の詳細なセグメンテーションの処理において有益であることがわかった。 TUTデータセット上のF1とmIoUスコアはそれぞれ0.8382と0.8473であり、最小の計算資源を必要としながら最先端(SOTA)のパフォーマンスを達成する。コードとデータセットはhttps://github.com/Karl1109/CrackSCFで公開されている。

関連論文リスト

Unleashing Degradation-Carrying Features in Symmetric U-Net: Simpler and Stronger Baselines for All-in-One Image Restoration [52.82397287366076]
オールインワン画像復元は、統合された枠組み内で様々な劣化(ノイズ、ぼかし、悪天候など)を扱うことを目的としている。本研究では, 優れた特徴抽出法により, 劣化伝達情報を本質的にエンコードする, 重要な知見を明らかにする。我々の対称設計は固有の劣化信号を頑健に保存し、スキップ接続に単純な加法融合を施す。
論文参考訳（メタデータ） (2025-12-11T12:20:31Z)
PRISM: Distributed Inference for Foundation Models at Edge [73.54372283220444]
PRISMは、エッジデバイス上での分散トランスフォーマー推論のための通信効率と計算アウェア戦略である。 ViT,BERT,GPT-2のPRISMを多種多様なデータセットで評価した。
論文参考訳（メタデータ） (2025-07-16T11:25:03Z)
Enhancing point cloud analysis via neighbor aggregation correction based on cross-stage structure correlation [22.48120946682699]
ポイントクラウド分析は、ポイントクラウドデータの理解の基礎となるローカル構造を集約する多くの下流タスクの基盤となる。本稿では,高次元空間における相関を利用してアグリゲーション中の特徴分布を補正する点分布集合抽象モジュール(PDSA)を提案する。 PDSAは、軽量なクロスステージ構造記述子に基づいて点相関を区別し、構造的均一性を高める。
論文参考訳（メタデータ） (2025-06-18T06:08:17Z)
SCSegamba: Lightweight Structure-Aware Vision Mamba for Crack Segmentation in Structures [29.224360412743454]
高品質な画素レベルのセグメンテーションマップを生成するために,SCSegamba(Structure-Aware Vision Mamba Network)を提案する。具体的には、軽量なGated Bottleneck Convolution(GBC)とStructure-Aware Scanning Strategy(SASS)を組み合わせたSAVSS(Structure-Aware Visual State Space Module)を開発した。クラックベンチマークを用いた実験により,本手法は他のSOTA法よりも優れており,パラメータが2.8Mで最高性能を達成できた。
論文参考訳（メタデータ） (2025-03-03T02:40:57Z)
Generalized Least Squares Kernelized Tensor Factorization [19.284198191705027]
テンソル完備化のための一般化Last Squares Kernelized Factorization (GL) フレームワークについて述べる。 GLは低ランク分解と局所的に相関した残留過程を統合する。提案するフレームワークは,空間的タスクにまたがる4つの実世界のデータセットで評価される。
論文参考訳（メタデータ） (2024-12-09T23:01:04Z)
Deep Learning-Based Fatigue Cracks Detection in Bridge Girders using Feature Pyramid Networks [8.59780173800845]
本研究では,橋梁の鋼箱桁のひび割れ情報を含む高分解能画像からの自動き裂分割手法を提案する。亀裂のマルチスケールの特徴を考慮し, 亀裂検出のための特徴ピラミッドネットワーク(FPN)の畳み込みニューラルネットワークアーキテクチャを提案する。
論文参考訳（メタデータ） (2024-10-28T16:16:15Z)
EfficientCrackNet: A Lightweight Model for Crack Segmentation [1.3689715712707347]
き裂検出は、建物、舗装、橋の構造的整合性を維持するために不可欠である。既存の軽量な手法は、計算の非効率性、複雑な亀裂パターン、難易度などの課題に直面していることが多い。本稿では,CNN(Convolutional Neural Networks)とトランスフォーマーを組み合わせた軽量ハイブリッドモデルであるEfficientCrackNetを提案する。
論文参考訳（メタデータ） (2024-09-26T17:44:20Z)
Hybrid-Segmentor: A Hybrid Approach to Automated Fine-Grained Crack Segmentation in Civil Infrastructure [52.2025114590481]
エンコーダ・デコーダをベースとした手法であるHybrid-Segmentorを導入する。これにより、モデルは、様々な種類の形状、表面、き裂の大きさを区別する一般化能力を向上させることができる。提案モデルは,5つの測定基準(精度0.971,精度0.804,リコール0.744,F1スコア0.770,IoUスコア0.630)で既存ベンチマークモデルより優れ,最先端の状態を達成している。
論文参考訳（メタデータ） (2024-09-04T16:47:16Z)
Simple Ingredients for Offline Reinforcement Learning [86.1988266277766]
オフライン強化学習アルゴリズムは、ターゲット下流タスクに高度に接続されたデータセットに有効であることが証明された。既存の手法が多様なデータと競合することを示す。その性能は、関連するデータ収集によって著しく悪化するが、オフラインバッファに異なるタスクを追加するだけでよい。アルゴリズム的な考慮以上のスケールが、パフォーマンスに影響を及ぼす重要な要因であることを示す。
論文参考訳（メタデータ） (2024-03-19T18:57:53Z)
Placing Objects in Context via Inpainting for Out-of-distribution Segmentation [59.00092709848619]
コンテキスト内のオブジェクトの配置(POC)は、イメージにオブジェクトを現実的に追加するためのパイプラインである。 POCは任意の数のオブジェクトで任意のデータセットを拡張するために使用することができる。本稿では,POC 生成データに基づく様々な異常セグメンテーションデータセットを提示し,最近の最先端の異常チューニング手法の性能向上を実証する。
論文参考訳（メタデータ） (2024-02-26T08:32:41Z)
Revisiting Generative Adversarial Networks for Binary Semantic Segmentation on Imbalanced Datasets [20.538287907723713]
異常き裂領域検出は典型的なバイナリセマンティックセグメンテーションタスクであり、アルゴリズムによって舗装面画像上のひび割れを表す画素を自動的に検出することを目的としている。既存のディープラーニングベースの手法は、特定の公共舗装のデータセットで優れた結果を得たが、不均衡なデータセットでは性能が劇的に低下する。画素レベルの異常き裂領域検出タスクに対して,条件付き生成逆ネットワーク(cGAN)に基づくディープラーニングフレームワークを提案する。
論文参考訳（メタデータ） (2024-02-03T19:24:40Z)
Depth-agnostic Single Image Dehazing [12.51359372069387]
本研究では, 深度に依存しないデータセット(DA-HAZE)を生成することで, ヘイズ密度とシーン深度の関係を分離する, 単純かつ斬新な合成法を提案する。実験によると、DA-HAZEでトレーニングされたモデルは、SOTSとDA-SOTSの相違が少なく、実世界のベンチマークで大幅に改善されている。我々は、専用に設計されたブロックが組み込まれているデハジングのために、U-Netベースのアーキテクチャを再考する。
論文参考訳（メタデータ） (2024-01-14T06:33:11Z)
Transforming Image Super-Resolution: A ConvFormer-based Efficient Approach [58.57026686186709]
本稿では, Convolutional Transformer Layer (ConvFormer) を導入し, ConvFormer-based Super-Resolution Network (CFSR) を提案する。 CFSRは畳み込みベースのアプローチとトランスフォーマーベースのアプローチの両方の利点を継承する。 CFSRは計算コストと性能のバランスが最適であることを示す実験である。
論文参考訳（メタデータ） (2024-01-11T03:08:00Z)
Infrastructure Crack Segmentation: Boundary Guidance Method and Benchmark Dataset [11.282003429161163]
本稿では, き裂の固有特性について検討し, き裂の識別に境界特性を導入する。境界誘導クラックセグメンテーションモデル(BGCrack)を、高頻度モジュールを含むターゲット構造とモジュールで構築する。本稿では, 鋼ひび割れの同定のための統一的, 公正なベンチマークを確立するための鋼ひび割れデータセットを提供する。
論文参考訳（メタデータ） (2023-06-15T15:25:53Z)
Neural ShDF: Reviving an Efficient and Consistent Mesh Segmentation Method [0.0]
本稿では,メッシュセグメンテーションに先立って,ディープラーニングを利用してマッピング関数を符号化する手法を提案する。我々のアプローチは、入力メッシュをダウンサンプルし、フル解像度構造をクエリするので、解像度に依存しない。
論文参考訳（メタデータ） (2023-06-14T18:27:39Z)
Unsupervised Space Partitioning for Nearest Neighbor Search [6.516813715425121]
本稿では,個別の損失関数を用いて分割処理と学習段階を結合するエンドツーエンド学習フレームワークを提案する。提案したソリューションの重要な利点は、データセットの高価な事前処理を必要としないことです。提案手法は,最先端空間分割法とユビキタスK平均クラスタリング法に勝ることを示す。
論文参考訳（メタデータ） (2022-06-16T11:17:03Z)
Real-Time Scene Text Detection with Differentiable Binarization and Adaptive Scale Fusion [62.269219152425556]
セグメンテーションに基づくシーンテキスト検出手法はシーンテキスト検出分野において大きな注目を集めている。本稿では,二項化処理をセグメンテーションネットワークに統合する分散二項化(DB)モジュールを提案する。アダプティブ・スケール・フュージョン (ASF) モジュールは, 異なるスケールの特徴を適応的に融合させることにより, スケールのロバスト性を向上させる。
論文参考訳（メタデータ） (2022-02-21T15:30:14Z)
Lightweight Salient Object Detection in Optical Remote Sensing Images via Feature Correlation [93.80710126516405]
本稿では,これらの問題に対処する軽量ORSI-SODソリューションであるCorrNetを提案する。それぞれのコンポーネントのパラメータと計算を減らし、CorrNetは4.09Mのパラメータしか持たず、21.09GのFLOPで実行している。 2つの公開データセットの実験結果から、私たちの軽量なCorrNetは、26の最先端メソッドと比較して、競争力やパフォーマンスがさらに向上することが示された。
論文参考訳（メタデータ） (2022-01-20T08:28:01Z)
Efficient Micro-Structured Weight Unification and Pruning for Neural Network Compression [56.83861738731913]
ディープニューラルネットワーク(DNN)モデルは、特にリソース制限されたデバイスにおいて、実用的なアプリケーションに不可欠である。既往の非構造的あるいは構造化された重量刈り法は、推論を真に加速することはほとんど不可能である。ハードウェア互換のマイクロ構造レベルでの一般化された重み統一フレームワークを提案し,高い圧縮と加速度を実現する。
論文参考訳（メタデータ） (2021-06-15T17:22:59Z)
A Holistically-Guided Decoder for Deep Representation Learning with Applications to Semantic Segmentation and Object Detection [74.88284082187462]
一般的な戦略の1つは、バックボーンネットワークに拡張畳み込みを採用し、高解像度のフィーチャーマップを抽出することです。本稿では,高分解能なセマンティクスリッチな特徴マップを得るために紹介される,新たなホリスティック誘導デコーダを提案する。
論文参考訳（メタデータ） (2020-12-18T10:51:49Z)
Structured Convolutions for Efficient Neural Network Design [65.36569572213027]
畳み込みニューラルネットワーク構築ブロックのテクスト単純構造における冗長性を利用してモデル効率に取り組む。この分解が2Dカーネルや3Dカーネルだけでなく、完全に接続されたレイヤにも適用可能であることを示す。
論文参考訳（メタデータ） (2020-08-06T04:38:38Z)
FarSee-Net: Real-Time Semantic Segmentation by Efficient Multi-scale Context Aggregation and Feature Space Super-resolution [14.226301825772174]
Cascaded Factorized Atrous Space Pyramid Pooling (CF-ASPP) と呼ばれる新しい効率的なモジュールについて紹介する。これは畳み込みニューラルネットワーク(CNN)のための軽量なカスケード構造であり、コンテキスト情報を効率的に活用する。我々は1枚のNivida Titan X (Maxwell) GPUカードでCityscapesテストセットの84fpsで68.4% mIoUを達成した。
論文参考訳（メタデータ） (2020-03-09T03:53:57Z)
Image Matching across Wide Baselines: From Paper to Practice [80.9424750998559]
局所的な特徴とロバストな推定アルゴリズムの包括的なベンチマークを導入する。パイプラインのモジュール構造は、さまざまなメソッドの容易な統合、構成、組み合わせを可能にします。適切な設定で、古典的な解決策は依然として芸術の知覚された状態を上回る可能性があることを示す。
論文参考訳（メタデータ） (2020-03-03T15:20:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。