Fugu-MT 論文翻訳(概要): CrackSCF: Lightweight Cascaded Fusion Network for Robust and Efficient Structural Crack Segmentation

論文の概要: CrackSCF: Lightweight Cascaded Fusion Network for Robust and Efficient Structural Crack Segmentation

arxiv url: http://arxiv.org/abs/2408.12815v4
Date: Fri, 19 Sep 2025 14:31:51 GMT
ステータス: 翻訳完了
システム内更新日: 2025-09-22 14:11:06.76533
Title: CrackSCF: Lightweight Cascaded Fusion Network for Robust and Efficient Structural Crack Segmentation
Title（参考訳）: CrackSCF:ロバストかつ効率的な構造き裂分離のための軽量カスケード核融合ネットワーク
Authors: Hui Liu, Chen Jia, Fan Shi, Xu Cheng, Mianzhao Wang, Shengyong Chen,
Abstract要約: CrackSCFは、堅牢なクラックセグメンテーションを実現するために設計された軽量なカスケード核融合クラックネットワークである。このアプローチは、最小の計算フットプリントで動作しながら、ローカルパターンを効率的にキャプチャする。実験結果から,CrackSCF法は既存の手法よりも一貫して優れていることがわかった。
参考スコア（独自算出の注目度）: 36.93774494071781
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Accurately segmenting structural cracks at the pixel level remains a major hurdle, as existing methods fail to integrate local textures with pixel dependencies, often leading to fragmented and incomplete predictions. Moreover, their high parameter counts and substantial computational demands hinder practical deployment on resource-constrained edge devices. To address these challenges, we propose CrackSCF, a Lightweight Cascaded Fusion Crack Segmentation Network designed to achieve robust crack segmentation with exceptional computational efficiency. We design a lightweight convolutional block (LRDS) to replace all standard convolutions. This approach efficiently captures local patterns while operating with a minimal computational footprint. For a holistic perception of crack structures, a lightweight Long-range Dependency Extractor (LDE) captures global dependencies. These are then intelligently unified with local patterns by our Staircase Cascaded Fusion Module (SCFM), ensuring the final segmentation maps are both seamless in continuity and rich in fine-grained detail. To comprehensively evaluate our method, we created the challenging TUT benchmark dataset and evaluated it alongside five other public datasets. The experimental results show that the CrackSCF method consistently outperforms the existing methods, and it demonstrates greater robustness in dealing with complex background noise. On the TUT dataset, CrackSCF achieved 0.8382 on F1 score and 0.8473 on mIoU, and it only required 4.79M parameters.
Abstract（参考訳）: 既存の手法では局所的なテクスチャをピクセル依存と統合できず、しばしば断片化され不完全な予測に繋がる。さらに、それらの高いパラメータ数と相当な計算要求は、リソース制約されたエッジデバイスへの実践的な展開を妨げている。これらの課題に対処するため, 計算効率に優れたき裂分割を実現するために設計された軽量カスケード核融合き裂分割ネットワークであるCrackSCFを提案する。我々は、すべての標準畳み込みを置き換える軽量畳み込みブロック(LRDS)を設計する。このアプローチは、最小の計算フットプリントで動作しながら、ローカルパターンを効率的にキャプチャする。ひび割れ構造の包括的認識のために、軽量な長距離依存性エクストラクタ(LDE)は、グローバルな依存関係をキャプチャする。そして、これらはStaircase Cascaded Fusion Module (SCFM)によって局所パターンとインテリジェントに統合され、最終的なセグメンテーションマップが連続性においてシームレスであり、きめ細かな詳細に富んでいることを保証します。提案手法を総合的に評価するために,挑戦的なTUTベンチマークデータセットを作成し,他の5つの公開データセットとともに評価した。実験結果から、CrackSCF法は既存の手法より一貫して優れており、複雑なバックグラウンドノイズに対処する際のロバスト性が高いことが示された。 TUTデータセットでは、CrackSCFはF1の0.8382、mIoUの0.8473を達成し、パラメータは4.79Mしか必要としなかった。

関連論文リスト

Unleashing Degradation-Carrying Features in Symmetric U-Net: Simpler and Stronger Baselines for All-in-One Image Restoration [52.82397287366076]
オールインワン画像復元は、統合された枠組み内で様々な劣化(ノイズ、ぼかし、悪天候など)を扱うことを目的としている。本研究では, 優れた特徴抽出法により, 劣化伝達情報を本質的にエンコードする, 重要な知見を明らかにする。我々の対称設計は固有の劣化信号を頑健に保存し、スキップ接続に単純な加法融合を施す。
論文参考訳（メタデータ） (2025-12-11T12:20:31Z)
PRISM: Distributed Inference for Foundation Models at Edge [73.54372283220444]
PRISMは、エッジデバイス上での分散トランスフォーマー推論のための通信効率と計算アウェア戦略である。 ViT,BERT,GPT-2のPRISMを多種多様なデータセットで評価した。
論文参考訳（メタデータ） (2025-07-16T11:25:03Z)
Enhancing point cloud analysis via neighbor aggregation correction based on cross-stage structure correlation [22.48120946682699]
ポイントクラウド分析は、ポイントクラウドデータの理解の基礎となるローカル構造を集約する多くの下流タスクの基盤となる。本稿では,高次元空間における相関を利用してアグリゲーション中の特徴分布を補正する点分布集合抽象モジュール(PDSA)を提案する。 PDSAは、軽量なクロスステージ構造記述子に基づいて点相関を区別し、構造的均一性を高める。
論文参考訳（メタデータ） (2025-06-18T06:08:17Z)
SCSegamba: Lightweight Structure-Aware Vision Mamba for Crack Segmentation in Structures [29.224360412743454]
高品質な画素レベルのセグメンテーションマップを生成するために,SCSegamba(Structure-Aware Vision Mamba Network)を提案する。具体的には、軽量なGated Bottleneck Convolution(GBC)とStructure-Aware Scanning Strategy(SASS)を組み合わせたSAVSS(Structure-Aware Visual State Space Module)を開発した。クラックベンチマークを用いた実験により,本手法は他のSOTA法よりも優れており,パラメータが2.8Mで最高性能を達成できた。
論文参考訳（メタデータ） (2025-03-03T02:40:57Z)
Generalized Least Squares Kernelized Tensor Factorization [19.284198191705027]
テンソル完備化のための一般化Last Squares Kernelized Factorization (GL) フレームワークについて述べる。 GLは低ランク分解と局所的に相関した残留過程を統合する。提案するフレームワークは,空間的タスクにまたがる4つの実世界のデータセットで評価される。
論文参考訳（メタデータ） (2024-12-09T23:01:04Z)
Deep Learning-Based Fatigue Cracks Detection in Bridge Girders using Feature Pyramid Networks [8.59780173800845]
本研究では,橋梁の鋼箱桁のひび割れ情報を含む高分解能画像からの自動き裂分割手法を提案する。亀裂のマルチスケールの特徴を考慮し, 亀裂検出のための特徴ピラミッドネットワーク(FPN)の畳み込みニューラルネットワークアーキテクチャを提案する。
論文参考訳（メタデータ） (2024-10-28T16:16:15Z)
EfficientCrackNet: A Lightweight Model for Crack Segmentation [1.3689715712707347]
き裂検出は、建物、舗装、橋の構造的整合性を維持するために不可欠である。既存の軽量な手法は、計算の非効率性、複雑な亀裂パターン、難易度などの課題に直面していることが多い。本稿では,CNN(Convolutional Neural Networks)とトランスフォーマーを組み合わせた軽量ハイブリッドモデルであるEfficientCrackNetを提案する。
論文参考訳（メタデータ） (2024-09-26T17:44:20Z)
Hybrid-Segmentor: A Hybrid Approach to Automated Fine-Grained Crack Segmentation in Civil Infrastructure [52.2025114590481]
エンコーダ・デコーダをベースとした手法であるHybrid-Segmentorを導入する。これにより、モデルは、様々な種類の形状、表面、き裂の大きさを区別する一般化能力を向上させることができる。提案モデルは,5つの測定基準(精度0.971,精度0.804,リコール0.744,F1スコア0.770,IoUスコア0.630)で既存ベンチマークモデルより優れ,最先端の状態を達成している。
論文参考訳（メタデータ） (2024-09-04T16:47:16Z)
Simple Ingredients for Offline Reinforcement Learning [86.1988266277766]
オフライン強化学習アルゴリズムは、ターゲット下流タスクに高度に接続されたデータセットに有効であることが証明された。既存の手法が多様なデータと競合することを示す。その性能は、関連するデータ収集によって著しく悪化するが、オフラインバッファに異なるタスクを追加するだけでよい。アルゴリズム的な考慮以上のスケールが、パフォーマンスに影響を及ぼす重要な要因であることを示す。
論文参考訳（メタデータ） (2024-03-19T18:57:53Z)
Placing Objects in Context via Inpainting for Out-of-distribution Segmentation [59.00092709848619]
コンテキスト内のオブジェクトの配置(POC)は、イメージにオブジェクトを現実的に追加するためのパイプラインである。 POCは任意の数のオブジェクトで任意のデータセットを拡張するために使用することができる。本稿では,POC 生成データに基づく様々な異常セグメンテーションデータセットを提示し,最近の最先端の異常チューニング手法の性能向上を実証する。
論文参考訳（メタデータ） (2024-02-26T08:32:41Z)
Revisiting Generative Adversarial Networks for Binary Semantic Segmentation on Imbalanced Datasets [20.538287907723713]
異常き裂領域検出は典型的なバイナリセマンティックセグメンテーションタスクであり、アルゴリズムによって舗装面画像上のひび割れを表す画素を自動的に検出することを目的としている。既存のディープラーニングベースの手法は、特定の公共舗装のデータセットで優れた結果を得たが、不均衡なデータセットでは性能が劇的に低下する。画素レベルの異常き裂領域検出タスクに対して,条件付き生成逆ネットワーク(cGAN)に基づくディープラーニングフレームワークを提案する。
論文参考訳（メタデータ） (2024-02-03T19:24:40Z)
Depth-agnostic Single Image Dehazing [12.51359372069387]
本研究では, 深度に依存しないデータセット(DA-HAZE)を生成することで, ヘイズ密度とシーン深度の関係を分離する, 単純かつ斬新な合成法を提案する。実験によると、DA-HAZEでトレーニングされたモデルは、SOTSとDA-SOTSの相違が少なく、実世界のベンチマークで大幅に改善されている。我々は、専用に設計されたブロックが組み込まれているデハジングのために、U-Netベースのアーキテクチャを再考する。
論文参考訳（メタデータ） (2024-01-14T06:33:11Z)
Transforming Image Super-Resolution: A ConvFormer-based Efficient Approach [58.57026686186709]
本稿では, Convolutional Transformer Layer (ConvFormer) を導入し, ConvFormer-based Super-Resolution Network (CFSR) を提案する。 CFSRは畳み込みベースのアプローチとトランスフォーマーベースのアプローチの両方の利点を継承する。 CFSRは計算コストと性能のバランスが最適であることを示す実験である。
論文参考訳（メタデータ） (2024-01-11T03:08:00Z)
Infrastructure Crack Segmentation: Boundary Guidance Method and Benchmark Dataset [11.282003429161163]
本稿では, き裂の固有特性について検討し, き裂の識別に境界特性を導入する。境界誘導クラックセグメンテーションモデル(BGCrack)を、高頻度モジュールを含むターゲット構造とモジュールで構築する。本稿では, 鋼ひび割れの同定のための統一的, 公正なベンチマークを確立するための鋼ひび割れデータセットを提供する。
論文参考訳（メタデータ） (2023-06-15T15:25:53Z)
Neural ShDF: Reviving an Efficient and Consistent Mesh Segmentation Method [0.0]
本稿では,メッシュセグメンテーションに先立って,ディープラーニングを利用してマッピング関数を符号化する手法を提案する。我々のアプローチは、入力メッシュをダウンサンプルし、フル解像度構造をクエリするので、解像度に依存しない。
論文参考訳（メタデータ） (2023-06-14T18:27:39Z)
Unsupervised Space Partitioning for Nearest Neighbor Search [6.516813715425121]
本稿では,個別の損失関数を用いて分割処理と学習段階を結合するエンドツーエンド学習フレームワークを提案する。提案したソリューションの重要な利点は、データセットの高価な事前処理を必要としないことです。提案手法は,最先端空間分割法とユビキタスK平均クラスタリング法に勝ることを示す。
論文参考訳（メタデータ） (2022-06-16T11:17:03Z)
Real-Time Scene Text Detection with Differentiable Binarization and Adaptive Scale Fusion [62.269219152425556]
セグメンテーションに基づくシーンテキスト検出手法はシーンテキスト検出分野において大きな注目を集めている。本稿では,二項化処理をセグメンテーションネットワークに統合する分散二項化(DB)モジュールを提案する。アダプティブ・スケール・フュージョン (ASF) モジュールは, 異なるスケールの特徴を適応的に融合させることにより, スケールのロバスト性を向上させる。
論文参考訳（メタデータ） (2022-02-21T15:30:14Z)
Lightweight Salient Object Detection in Optical Remote Sensing Images via Feature Correlation [93.80710126516405]
本稿では,これらの問題に対処する軽量ORSI-SODソリューションであるCorrNetを提案する。それぞれのコンポーネントのパラメータと計算を減らし、CorrNetは4.09Mのパラメータしか持たず、21.09GのFLOPで実行している。 2つの公開データセットの実験結果から、私たちの軽量なCorrNetは、26の最先端メソッドと比較して、競争力やパフォーマンスがさらに向上することが示された。
論文参考訳（メタデータ） (2022-01-20T08:28:01Z)
Efficient Micro-Structured Weight Unification and Pruning for Neural Network Compression [56.83861738731913]
ディープニューラルネットワーク(DNN)モデルは、特にリソース制限されたデバイスにおいて、実用的なアプリケーションに不可欠である。既往の非構造的あるいは構造化された重量刈り法は、推論を真に加速することはほとんど不可能である。ハードウェア互換のマイクロ構造レベルでの一般化された重み統一フレームワークを提案し,高い圧縮と加速度を実現する。
論文参考訳（メタデータ） (2021-06-15T17:22:59Z)
A Holistically-Guided Decoder for Deep Representation Learning with Applications to Semantic Segmentation and Object Detection [74.88284082187462]
一般的な戦略の1つは、バックボーンネットワークに拡張畳み込みを採用し、高解像度のフィーチャーマップを抽出することです。本稿では,高分解能なセマンティクスリッチな特徴マップを得るために紹介される,新たなホリスティック誘導デコーダを提案する。
論文参考訳（メタデータ） (2020-12-18T10:51:49Z)
Structured Convolutions for Efficient Neural Network Design [65.36569572213027]
畳み込みニューラルネットワーク構築ブロックのテクスト単純構造における冗長性を利用してモデル効率に取り組む。この分解が2Dカーネルや3Dカーネルだけでなく、完全に接続されたレイヤにも適用可能であることを示す。
論文参考訳（メタデータ） (2020-08-06T04:38:38Z)
FarSee-Net: Real-Time Semantic Segmentation by Efficient Multi-scale Context Aggregation and Feature Space Super-resolution [14.226301825772174]
Cascaded Factorized Atrous Space Pyramid Pooling (CF-ASPP) と呼ばれる新しい効率的なモジュールについて紹介する。これは畳み込みニューラルネットワーク(CNN)のための軽量なカスケード構造であり、コンテキスト情報を効率的に活用する。我々は1枚のNivida Titan X (Maxwell) GPUカードでCityscapesテストセットの84fpsで68.4% mIoUを達成した。
論文参考訳（メタデータ） (2020-03-09T03:53:57Z)
Image Matching across Wide Baselines: From Paper to Practice [80.9424750998559]
局所的な特徴とロバストな推定アルゴリズムの包括的なベンチマークを導入する。パイプラインのモジュール構造は、さまざまなメソッドの容易な統合、構成、組み合わせを可能にします。適切な設定で、古典的な解決策は依然として芸術の知覚された状態を上回る可能性があることを示す。
論文参考訳（メタデータ） (2020-03-03T15:20:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。