論文の概要: Dual Attention U-Net with Feature Infusion: Pushing the Boundaries of
Multiclass Defect Segmentation
- arxiv url: http://arxiv.org/abs/2312.14053v1
- Date: Thu, 21 Dec 2023 17:23:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-22 13:53:27.674408
- Title: Dual Attention U-Net with Feature Infusion: Pushing the Boundaries of
Multiclass Defect Segmentation
- Title(参考訳): 特徴注入を伴うデュアルアテンションU-Net:マルチクラス欠陥セグメンテーションの境界を押し上げる
- Authors: Rasha Alshawi, Md Tamjidul Hoque, Md Meftahul Ferdaus, Mahdi
Abdelguerfi, Kendall Niles, Ken Prathak, Joe Tom, Jordan Klein, Murtada
Mousa, and Johny Javier Lopez
- Abstract要約: 提案アーキテクチャであるDual Attentive U-Net with Feature Infusion (DAU-FI Net)はセマンティックセグメンテーションにおける課題に対処する。
DAU-FI Netは、複数スケールの空間チャネルアテンション機構と特徴注入を統合し、オブジェクトのローカライゼーションの精度を高める。
挑戦的な下水道管と、欠陥データセットと、DAU-FI Netの能力を検証したベンチマークデータセットに関する総合的な実験。
- 参考スコア(独自算出の注目度): 1.487252325779766
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The proposed architecture, Dual Attentive U-Net with Feature Infusion (DAU-FI
Net), addresses challenges in semantic segmentation, particularly on multiclass
imbalanced datasets with limited samples. DAU-FI Net integrates multiscale
spatial-channel attention mechanisms and feature injection to enhance precision
in object localization. The core employs a multiscale depth-separable
convolution block, capturing localized patterns across scales. This block is
complemented by a spatial-channel squeeze and excitation (scSE) attention unit,
modeling inter-dependencies between channels and spatial regions in feature
maps. Additionally, additive attention gates refine segmentation by connecting
encoder-decoder pathways.
To augment the model, engineered features using Gabor filters for textural
analysis, Sobel and Canny filters for edge detection are injected guided by
semantic masks to expand the feature space strategically. Comprehensive
experiments on a challenging sewer pipe and culvert defect dataset and a
benchmark dataset validate DAU-FI Net's capabilities. Ablation studies
highlight incremental benefits from attention blocks and feature injection.
DAU-FI Net achieves state-of-the-art mean Intersection over Union (IoU) of
95.6% and 98.8% on the defect test set and benchmark respectively, surpassing
prior methods by 8.9% and 12.6%, respectively. Ablation studies highlight
incremental benefits from attention blocks and feature injection. The proposed
architecture provides a robust solution, advancing semantic segmentation for
multiclass problems with limited training data. Our sewer-culvert defects
dataset, featuring pixel-level annotations, opens avenues for further research
in this crucial domain. Overall, this work delivers key innovations in
architecture, attention, and feature engineering to elevate semantic
segmentation efficacy.
- Abstract(参考訳): 提案されたアーキテクチャであるdau-fi net(dau-fi net)は、セマンティクスセグメンテーションにおける課題、特に限られたサンプルを持つマルチクラス不均衡データセットに対処する。
DAU-FI Netは、複数スケールの空間チャネルアテンション機構と特徴注入を統合し、オブジェクトのローカライゼーションの精度を高める。
コアはマルチスケールの深さ分離可能な畳み込みブロックを採用し、スケールにまたがる局所的なパターンをキャプチャする。
このブロックはspatial-channel squeeze and excitation (scse) attention unitによって補完され、特徴写像におけるチャネルと空間領域の間の相互依存性をモデル化する。
さらに、追加注意ゲートはエンコーダ-デコーダ経路を接続することでセグメンテーションを洗練する。
モデルを強化するために,ガボルフィルタを用いたテクスチャ解析,エッジ検出のためのソベルフィルタとカニーフィルタをセマンティックマスクで誘導し,特徴空間を戦略的に拡張する。
挑戦的な下水道管と、欠陥データセットと、DAU-FI Netの能力を検証したベンチマークデータセットに関する総合的な実験。
アブレーション研究は、注意ブロックと特徴注入による漸進的なメリットを強調している。
dau-fi netは、欠陥テストセットとベンチマークでそれぞれ95.6%と98.8%の最先端平均交点を達成し、それぞれ8.9%と12.6%を上回った。
アブレーション研究は、注意ブロックと特徴注入による漸進的なメリットを強調している。
提案されたアーキテクチャは、トレーニングデータに制限のあるマルチクラス問題のセマンティクスセグメンテーションを進める、堅牢なソリューションを提供する。
ピクセルレベルのアノテーションを特徴とする下水道の欠陥データセットは、この重要な領域におけるさらなる研究の道を開く。
全体として、この作業はセマンティックセグメンテーションの有効性を高めるために、アーキテクチャ、注意、機能エンジニアリングにおいて重要な革新をもたらす。
関連論文リスト
- Renormalized Connection for Scale-preferred Object Detection in Satellite Imagery [51.83786195178233]
我々は、効率的な特徴抽出の観点から再正規化群理論を実装するために、知識発見ネットワーク(KDN)を設計する。
KDN上の再正規化接続(RC)は、マルチスケール特徴の「相乗的焦点」を可能にする。
RCはFPNベースの検出器のマルチレベル特徴の分割・対数機構を幅広いスケールで予測されたタスクに拡張する。
論文 参考訳(メタデータ) (2024-09-09T13:56:22Z) - PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。
PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。
PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文 参考訳(メタデータ) (2024-08-26T19:43:01Z) - Learning Spatial-Semantic Features for Robust Video Object Segmentation [108.045326229865]
空間意味的特徴と識別的オブジェクトクエリを備えたロバストなビデオオブジェクトセグメンテーションフレームワークを提案する。
提案手法は,複数のデータセットに対して新しい最先端性能を設定できることを示す。
論文 参考訳(メタデータ) (2024-07-10T15:36:00Z) - SNE-RoadSegV2: Advancing Heterogeneous Feature Fusion and Fallibility Awareness for Freespace Detection [29.348921424716057]
本稿では、全体的注意モジュール、異種特徴コントラスト記述子、親和性重み付き特徴校正器からなる新規な異種特徴融合ブロックを提案する。
スケール内およびスケール内の両方のスキップ接続をデコーダアーキテクチャに組み込むと同時に、冗長な接続を排除し、精度と計算効率を向上させる。
セマンティック・トランジションと深度不整合領域に別々に焦点をあてる2つの誤認認識損失関数を導入し、モデルトレーニングにおけるより深い監督に寄与する。
論文 参考訳(メタデータ) (2024-02-29T07:20:02Z) - Accurate and lightweight dehazing via multi-receptive-field non-local
network and novel contrastive regularization [9.90146712189936]
本稿では,マルチ受信フィールド非局所ネットワーク(MRFNLN)を提案する。
マルチストリーム機能アテンションブロック(MSFAB)とクロス非ローカルブロック(CNLB)として設計されている。
これは、150万のパラメータ未満の最近の最先端の脱ハージング手法よりも優れています。
論文 参考訳(メタデータ) (2023-09-28T14:59:16Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - TC-Net: Triple Context Network for Automated Stroke Lesion Segmentation [0.5482532589225552]
本稿では,空間的コンテキスト情報を中心として,新たなネットワークである Triple Context Network (TC-Net) を提案する。
我々のネットワークはオープンデータセットATLASで評価され、最高スコアは0.594、ハウスドルフ距離は27.005mm、平均対称性表面距離は7.137mmである。
論文 参考訳(メタデータ) (2022-02-28T11:12:16Z) - An Attention-Fused Network for Semantic Segmentation of
Very-High-Resolution Remote Sensing Imagery [26.362854938949923]
注目融合ネットワーク(AFNet)という,新しい畳み込みニューラルネットワークアーキテクチャを提案する。
ISPRS Vaihingen 2DデータセットとISPRS Potsdam 2Dデータセットで、総精度91.7%、平均F1スコア90.96%の最先端のパフォーマンスを実現します。
論文 参考訳(メタデータ) (2021-05-10T06:23:27Z) - Multi-Attention-Network for Semantic Segmentation of Fine Resolution
Remote Sensing Images [10.835342317692884]
リモートセンシング画像におけるセマンティックセグメンテーションの精度は、ディープ畳み込みニューラルネットワークによって著しく向上した。
本稿では,これらの問題に対処するマルチアテンション・ネットワーク(MANet)を提案する。
線形複雑性を伴うカーネル注意の新たなアテンション機構が提案され,注目される計算負荷の低減が図られた。
論文 参考訳(メタデータ) (2020-09-03T09:08:02Z) - Cross-layer Feature Pyramid Network for Salient Object Detection [102.20031050972429]
本稿では,有能な物体検出における進行的融合を改善するために,新しいクロス層特徴ピラミッドネットワークを提案する。
レイヤごとの分散機能は、他のすべてのレイヤからセマンティクスと健全な詳細の両方を同時に所有し、重要な情報の損失を減らします。
論文 参考訳(メタデータ) (2020-02-25T14:06:27Z) - Depthwise Non-local Module for Fast Salient Object Detection Using a
Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。
提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文 参考訳(メタデータ) (2020-01-22T15:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。