論文の概要: AD-Net: Attention-based dilated convolutional residual network with guided decoder for robust skin lesion segmentation
- arxiv url: http://arxiv.org/abs/2409.05420v1
- Date: Mon, 9 Sep 2024 08:21:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-10 15:20:29.171058
- Title: AD-Net: Attention-based dilated convolutional residual network with guided decoder for robust skin lesion segmentation
- Title(参考訳): AD-Net: 頑健な皮膚病変に対するガイドデコーダを用いた注意ベース拡張畳み込み残基ネットワーク
- Authors: Asim Naveed, Syed S. Naqvi, Tariq M. Khan, Shahzaib Iqbal, M. Yaqoob Wani, Haroon Ahmed Khan,
- Abstract要約: 本研究では,拡張畳み込み残差ネットワークを用いたロバストなアプローチを提案する。
注意に基づく空間特徴拡張ブロック(ASFEB)を搭載し、ガイド付きデコーダ戦略を採用している。
提案したAD-Netの有効性を,4つの公開ベンチマークデータセットを用いて評価した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In computer-aided diagnosis tools employed for skin cancer treatment and early diagnosis, skin lesion segmentation is important. However, achieving precise segmentation is challenging due to inherent variations in appearance, contrast, texture, and blurry lesion boundaries. This research presents a robust approach utilizing a dilated convolutional residual network, which incorporates an attention-based spatial feature enhancement block (ASFEB) and employs a guided decoder strategy. In each dilated convolutional residual block, dilated convolution is employed to broaden the receptive field with varying dilation rates. To improve the spatial feature information of the encoder, we employed an attention-based spatial feature enhancement block in the skip connections. The ASFEB in our proposed method combines feature maps obtained from average and maximum-pooling operations. These combined features are then weighted using the active outcome of global average pooling and convolution operations. Additionally, we have incorporated a guided decoder strategy, where each decoder block is optimized using an individual loss function to enhance the feature learning process in the proposed AD-Net. The proposed AD-Net presents a significant benefit by necessitating fewer model parameters compared to its peer methods. This reduction in parameters directly impacts the number of labeled data required for training, facilitating faster convergence during the training process. The effectiveness of the proposed AD-Net was evaluated using four public benchmark datasets. We conducted a Wilcoxon signed-rank test to verify the efficiency of the AD-Net. The outcomes suggest that our method surpasses other cutting-edge methods in performance, even without the implementation of data augmentation strategies.
- Abstract(参考訳): 皮膚がん治療や早期診断に使用されるコンピュータ支援診断ツールでは,皮膚病変の分節が重要である。
しかし、外観、コントラスト、テクスチャ、ぼやけた病変の境界に固有の違いがあるため、正確なセグメンテーションを達成することは困難である。
本研究では,アテンションベースの空間的特徴拡張ブロック(ASFEB)を組み込んだ拡張畳み込み残差ネットワークを用いて,ガイド付きデコーダ戦略を用いたロバストなアプローチを提案する。
各拡張畳み込み残差ブロックでは、拡張畳み込みを用いて、異なる拡張率で受容場を広げる。
符号化器の空間的特徴情報を改善するために,スキップ接続に注意に基づく空間的特徴強調ブロックを用いた。
提案手法におけるASFEBは,平均および最大プール操作から得られた特徴写像を組み合わせたものである。
これらの組み合わせは、グローバル平均プールと畳み込み操作のアクティブな結果を用いて重み付けされる。
さらに、各デコーダブロックを個別の損失関数を用いて最適化し、提案したAD-Netの機能学習プロセスを強化するガイド付きデコーダ戦略を組み込んだ。
提案したAD-Netは、ピアメソッドに比べてモデルパラメータを少なくする必要があるという大きな利点を示している。
このパラメータの削減は、トレーニングに必要なラベル付きデータの数に直接影響を与え、トレーニングプロセス中により高速な収束を促進する。
提案したAD-Netの有効性を,4つの公開ベンチマークデータセットを用いて評価した。
我々は,AD-Netの有効性を検証するために,Wilcoxon符号ランク試験を行った。
その結果,データ拡張戦略を実装しなくても,本手法が他の最先端手法を上回ることが示唆された。
関連論文リスト
- MDFI-Net: Multiscale Differential Feature Interaction Network for Accurate Retinal Vessel Segmentation [3.152646316470194]
本稿では,MDFI-Net という DPCN に基づく機能拡張型インタラクションネットワークを提案する。
提案したMDFI-Netは,公開データセットの最先端手法よりもセグメンテーション性能が優れている。
論文 参考訳(メタデータ) (2024-10-20T16:42:22Z) - BetterNet: An Efficient CNN Architecture with Residual Learning and Attention for Precision Polyp Segmentation [0.6062751776009752]
本研究では,ポリプセグメンテーションの精度を高めるために,残差学習と注意法を組み合わせた畳み込みニューラルネットワークアーキテクチャであるBetterNetを提案する。
BetterNetは、ポリープの検出と癌の早期認識を強化するために、コンピュータ支援診断技術を統合することを約束している。
論文 参考訳(メタデータ) (2024-05-05T21:08:49Z) - CV-Attention UNet: Attention-based UNet for 3D Cerebrovascular Segmentation of Enhanced TOF-MRA Images [2.2265536092123006]
脳血管画像の正確な抽出にはCV-AttentionUNetと呼ばれる3次元脳血管注意UNet法を提案する。
低と高のセマンティクスを組み合わせるために,注意機構を適用した。
このアルゴリズムの新規性は、ラベル付きデータとラベルなしデータの両方でうまく機能する能力にあると考えています。
論文 参考訳(メタデータ) (2023-11-16T22:31:05Z) - PREM: A Simple Yet Effective Approach for Node-Level Graph Anomaly
Detection [65.24854366973794]
ノードレベルのグラフ異常検出(GAD)は、医学、ソーシャルネットワーク、eコマースなどの分野におけるグラフ構造化データから異常ノードを特定する上で重要な役割を果たす。
本稿では,GADの効率を向上させるために,PREM (preprocessing and Matching) という簡単な手法を提案する。
我々のアプローチは、強力な異常検出機能を維持しながら、GADを合理化し、時間とメモリ消費を削減します。
論文 参考訳(メタデータ) (2023-10-18T02:59:57Z) - ARHNet: Adaptive Region Harmonization for Lesion-aware Augmentation to
Improve Segmentation Performance [61.04246102067351]
本研究では,合成画像をよりリアルに見せるために,前景調和フレームワーク(ARHNet)を提案する。
実画像と合成画像を用いたセグメンテーション性能の向上に本手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-07-02T10:39:29Z) - Retinal Vessel Segmentation via a Multi-resolution Contextual Network
and Adversarial Learning [4.776465250559035]
本稿では,意味的に異なる特徴間のコンテキスト依存を学習するためのマルチレゾリューション・コンテクスト・ネットワーク(MRC-Net)を提案する。
本手法は,DRIVE,STARE,CHASEの3つのベンチマークデータセットを用いて評価を行った。
論文 参考訳(メタデータ) (2023-04-25T14:27:34Z) - Adaptive Multi-scale Online Likelihood Network for AI-assisted
Interactive Segmentation [3.3909100561725127]
既存の対話的セグメンテーション手法はラベルリファインメントに自動セグメンテーションとユーザインタラクションを利用する。
データ効率の良いオンライン環境で適応的に学習する適応型マルチスケールオンライン可能性ネットワーク(MONET)を提案する。
我々のアプローチは、Diceのスコアが5.86%高く、NASA-TLXのワークロードスコアが最先端のものよりも24.67%低かった。
論文 参考訳(メタデータ) (2023-03-23T22:20:56Z) - PCA: Semi-supervised Segmentation with Patch Confidence Adversarial
Training [52.895952593202054]
医用画像セグメンテーションのためのPatch Confidence Adrial Training (PCA) と呼ばれる半教師付き対向法を提案する。
PCAは各パッチの画素構造とコンテキスト情報を学習し、十分な勾配フィードバックを得る。
本手法は, 医用画像のセグメンテーションにおいて, 最先端の半教師付き手法より優れており, その有効性を示している。
論文 参考訳(メタデータ) (2022-07-24T07:45:47Z) - Real-time landmark detection for precise endoscopic submucosal
dissection via shape-aware relation network [51.44506007844284]
内視鏡下粘膜下郭清術における高精度かつリアルタイムなランドマーク検出のための形状認識型関係ネットワークを提案する。
まず,ランドマーク間の空間的関係に関する先行知識を直感的に表現する関係キーポイント・ヒートマップを自動生成するアルゴリズムを考案する。
次に、事前知識を学習プロセスに段階的に組み込むために、2つの補完的な正規化手法を開発する。
論文 参考訳(メタデータ) (2021-11-08T07:57:30Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - An Uncertainty-Driven GCN Refinement Strategy for Organ Segmentation [53.425900196763756]
本研究では,不確実性解析とグラフ畳み込みネットワークに基づくセグメンテーション改善手法を提案する。
半教師付きグラフ学習問題を定式化するために、特定の入力ボリュームにおける畳み込みネットワークの不確実性レベルを用いる。
本手法は膵臓で1%,脾臓で2%向上し,最先端のCRF改善法よりも優れていた。
論文 参考訳(メタデータ) (2020-12-06T18:55:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。