論文の概要: SHARP-Net: A Refined Pyramid Network for Deficiency Segmentation in Culverts and Sewer Pipes
- arxiv url: http://arxiv.org/abs/2408.08879v1
- Date: Fri, 2 Aug 2024 23:55:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-25 14:30:57.226410
- Title: SHARP-Net: A Refined Pyramid Network for Deficiency Segmentation in Culverts and Sewer Pipes
- Title(参考訳): SHARP-Net:Culvertと下水道管の欠陥分割のための精製ピラミッドネットワーク
- Authors: Rasha Alshawi, Md Meftahul Ferdaus, Md Tamjidul Hoque, Kendall Niles, Ken Pathak, Steve Sloan, Mahdi Abdelguerfi,
- Abstract要約: SHARP-Netはセマンティックセグメンテーションのための新しいアーキテクチャである。
Inceptionのようなブロックとさまざまなフィルタサイズを備えたボトムアップパスを統合している。
ネットワーク全体を通して、複雑さを減らすために深度的に分離可能な畳み込みが使用される。
- 参考スコア(独自算出の注目度): 1.663204995903499
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper introduces Semantic Haar-Adaptive Refined Pyramid Network (SHARP-Net), a novel architecture for semantic segmentation. SHARP-Net integrates a bottom-up pathway featuring Inception-like blocks with varying filter sizes (3x3$ and 5x5), parallel max-pooling, and additional spatial detection layers. This design captures multi-scale features and fine structural details. Throughout the network, depth-wise separable convolutions are used to reduce complexity. The top-down pathway of SHARP-Net focuses on generating high-resolution features through upsampling and information fusion using $1\times1$ and $3\times3$ depth-wise separable convolutions. We evaluated our model using our developed challenging Culvert-Sewer Defects dataset and the benchmark DeepGlobe Land Cover dataset. Our experimental evaluation demonstrated the base model's (excluding Haar-like features) effectiveness in handling irregular defect shapes, occlusions, and class imbalances. It outperformed state-of-the-art methods, including U-Net, CBAM U-Net, ASCU-Net, FPN, and SegFormer, achieving average improvements of 14.4% and 12.1% on the Culvert-Sewer Defects and DeepGlobe Land Cover datasets, respectively, with IoU scores of 77.2% and 70.6%. Additionally, the training time was reduced. Furthermore, the integration of carefully selected and fine-tuned Haar-like features enhanced the performance of deep learning models by at least 20%. The proposed SHARP-Net, incorporating Haar-like features, achieved an impressive IoU of 94.75%, representing a 22.74% improvement over the base model. These features were also applied to other deep learning models, showing a 35.0% improvement, proving their versatility and effectiveness. SHARP-Net thus provides a powerful and efficient solution for accurate semantic segmentation in challenging real-world scenarios.
- Abstract(参考訳): 本稿では,意味的セグメンテーションのための新しいアーキテクチャであるSemantic Haar-Adaptive Refined Pyramid Network (SHARP-Net)を紹介する。
SHARP-Netは、インセプションに似たブロックと様々なフィルタサイズ(3x3$と5x5)、並列マックスプーリング、追加の空間検出層を備えたボトムアップ経路を統合している。
この設計は、マルチスケールの特徴と詳細な構造を捉えている。
ネットワーク全体を通して、複雑さを減らすために深度的に分離可能な畳み込みが使用される。
SHARP-Netのトップダウンパスは、奥行きの分離可能な畳み込み(deep-wise separable convolutions)を使用して、アップサンプリングと情報融合によって高解像度のフィーチャを生成することに焦点を当てている。
Culvert-Swer DefectsデータセットとベンチマークによるDeepGlobe Land Coverデータセットを用いて,本モデルの評価を行った。
実験により, 不規則な欠陥形状, 閉塞, クラス不均衡を扱う上で, ベースモデルの有効性(ハール様の特徴を除く)を実証した。
U-Net、CBAM U-Net、ASCU-Net、FPN、SegFormerなどの最先端の手法より優れており、Culvert-Sewer DefectsとDeepGlobe Land Coverのデータセットで平均14.4%と12.1%の改善を達成し、IoUのスコアは77.2%と70.6%だった。
また、訓練時間も短縮された。
さらに、慎重に選択されたHaarのような機能の統合により、ディープラーニングモデルの性能は少なくとも20%向上した。
提案されたSHARP-NetはHaarライクな特徴を取り入れ、94.75%の印象的なIoUを達成し、ベースモデルよりも22.74%改善した。
これらの機能は、他のディープラーニングモデルにも適用され、35.0%の改善を示し、その汎用性と有効性を証明した。
これにより、SHARP-Netは、現実世界の挑戦的なシナリオにおいて、正確なセマンティックセグメンテーションのための強力で効率的なソリューションを提供する。
関連論文リスト
- Imbalance-Aware Culvert-Sewer Defect Segmentation Using an Enhanced Feature Pyramid Network [1.7466076090043157]
本稿では,不均衡なデータセット内での変質管と下水道管のセマンティックセグメンテーションの深層学習モデルを提案する。
このモデルは、データセットの不均衡に対応するために、クラス分解やデータ拡張のような戦略を採用している。
E-FPNが最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2024-08-19T17:40:18Z) - Depth Estimation using Weighted-loss and Transfer Learning [2.428301619698667]
転送学習と最適化された損失関数を用いた深度推定精度の向上のための簡易かつ適応的なアプローチを提案する。
本研究では,移動学習と最適損失関数を用いた深度推定精度向上のための簡易かつ適応的な手法を提案する。
EfficientNetが最も成功したアーキテクチャである。
論文 参考訳(メタデータ) (2024-04-11T12:25:54Z) - NeRF-Det++: Incorporating Semantic Cues and Perspective-aware Depth
Supervision for Indoor Multi-View 3D Detection [72.0098999512727]
NeRF-Detは、NeRFを用いた屋内マルチビュー3次元検出において、表現学習の強化による優れた性能を実現している。
セマンティックエンハンスメント(セマンティックエンハンスメント)、パースペクティブ・アウェア・サンプリング(パースペクティブ・アウェア・サンプリング)、および順序深度監視を含む3つのソリューションを提案する。
結果として得られたアルゴリズムであるNeRF-Det++は、ScanNetV2とAR KITScenesデータセットで魅力的なパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-02-22T11:48:06Z) - Performance Analysis of Various EfficientNet Based U-Net++ Architecture
for Automatic Building Extraction from High Resolution Satellite Images [0.0]
ビルディング抽出は高解像度リモートセンシング画像のセマンティックセグメンテーションに大きく依存している。
本研究では,ネットワークバックボーンをベースとした様々なU-Net++を提案する。
実験結果によると,提案モデルは従来の最先端アプローチよりも有意に優れていた。
論文 参考訳(メタデータ) (2023-09-05T18:14:14Z) - SmoothNets: Optimizing CNN architecture design for differentially
private deep learning [69.10072367807095]
DPSGDは、サンプルごとの勾配の切り抜きとノイズ付けを必要とする。
これにより、非プライベートトレーニングと比較してモデルユーティリティが削減される。
SmoothNetと呼ばれる新しいモデルアーキテクチャを蒸留し,DP-SGDトレーニングの課題に対するロバスト性の向上を特徴とした。
論文 参考訳(メタデータ) (2022-05-09T07:51:54Z) - FatNet: A Feature-attentive Network for 3D Point Cloud Processing [1.502579291513768]
本稿では,グローバルポイントベースの機能とエッジベースの機能を組み合わせた,新たな機能指向ニューラルネットワーク層であるfat layerを提案する。
当社のアーキテクチャは,ModelNet40データセットで示すように,ポイントクラウド分類のタスクにおける最先端の成果を達成する。
論文 参考訳(メタデータ) (2021-04-07T23:13:56Z) - PLADE-Net: Towards Pixel-Level Accuracy for Self-Supervised Single-View
Depth Estimation with Neural Positional Encoding and Distilled Matting Loss [49.66736599668501]
PLADE-Netと呼ばれる自己監視型単視点画素レベルの高精度深度推定ネットワークを提案する。
提案手法は,KITTIデータセットの$delta1$測定値の95%を超え,前例のない精度を示す。
論文 参考訳(メタデータ) (2021-03-12T15:54:46Z) - $P^2$ Net: Augmented Parallel-Pyramid Net for Attention Guided Pose
Estimation [69.25492391672064]
拡張ボトルネックとアテンションモジュールによる特徴改善を施したパラレルピラミドネットを提案する。
並列ピラミド構造は、ネットワークによって導入された情報損失を補うために続く。
提案手法は, MSCOCO と MPII のデータセットにおいて, 最適な性能を実現する。
論文 参考訳(メタデータ) (2020-10-26T02:10:12Z) - Multi-scale Attention U-Net (MsAUNet): A Modified U-Net Architecture for
Scene Segmentation [1.713291434132985]
画像からコンテキスト情報を用いたシーンセグメンテーションのためのマルチスケールアテンションネットワークを提案する。
このネットワークは、局所的な特徴をグローバルな特徴にマップし、精度を向上し、識別画像領域を強調する。
我々はPascalVOC2012とADE20kという2つの標準データセットでモデルを評価した。
論文 参考訳(メタデータ) (2020-09-15T08:03:41Z) - Hierarchical Dynamic Filtering Network for RGB-D Salient Object
Detection [91.43066633305662]
RGB-D Salient Object Detection (SOD) の主な目的は、相互融合情報をよりよく統合し活用する方法である。
本稿では,これらの問題を新たな視点から考察する。
我々は、より柔軟で効率的なマルチスケールのクロスモーダルな特徴処理を実装している。
論文 参考訳(メタデータ) (2020-07-13T07:59:55Z) - When Residual Learning Meets Dense Aggregation: Rethinking the
Aggregation of Deep Neural Networks [57.0502745301132]
我々は,グローバルな残差学習と局所的なマイクロセンスアグリゲーションを備えた新しいアーキテクチャであるMicro-Dense Netsを提案する。
我々のマイクロセンスブロックはニューラルアーキテクチャ検索に基づくモデルと統合して性能を向上させることができる。
論文 参考訳(メタデータ) (2020-04-19T08:34:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。