論文の概要: Attention W-Net: Improved Skip Connections for better Representations
- arxiv url: http://arxiv.org/abs/2110.08811v1
- Date: Sun, 17 Oct 2021 12:44:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-19 18:14:21.240690
- Title: Attention W-Net: Improved Skip Connections for better Representations
- Title(参考訳): 注意W-Net: より良い表現のためのスキップ接続の改善
- Authors: Shikhar Mohan, Saumik Bhattacharya, Sayantari Ghosh
- Abstract要約: 我々は網膜血管分割のための新しいU-NetアーキテクチャであるAttention W-Netを提案する。
我々はAUCとF1スコアの0.8407と0.9833を観測し、LadderNetのバックボーンを大きく改善した。
- 参考スコア(独自算出の注目度): 5.027571997864707
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Segmentation of macro and microvascular structures in fundoscopic retinal
images plays a crucial role in detection of multiple retinal and systemic
diseases, yet it is a difficult problem to solve. Most deep learning approaches
for this task involve an autoencoder based architecture, but they face several
issues such as lack of enough parameters, overfitting when there are enough
parameters and incompatibility between internal feature-spaces. Due to such
issues, these techniques are hence not able to extract the best semantic
information from the limited data present for such tasks. We propose Attention
W-Net, a new U-Net based architecture for retinal vessel segmentation to
address these problems. In this architecture with a LadderNet backbone, we have
two main contributions: Attention Block and regularisation measures. Our
Attention Block uses decoder features to attend over the encoder features from
skip-connections during upsampling, resulting in higher compatibility when the
encoder and decoder features are added. Our regularisation measures include
image augmentation and modifications to the ResNet Block used, which prevent
overfitting. With these additions, we observe an AUC and F1-Score of 0.8407 and
0.9833 - a sizeable improvement over its LadderNet backbone as well as
competitive performance among the contemporary state-of-the-art methods.
- Abstract(参考訳): 眼底鏡視下網膜像におけるマクロ・微小血管構造の分離は,多発網膜・全身疾患の検出において重要な役割を担っているが,解決は困難である。
このタスクの最も深い学習アプローチは、オートエンコーダベースのアーキテクチャであるが、十分なパラメータの不足、十分なパラメータがある場合の過度な適合、内部機能空間間の非互換性など、いくつかの問題に直面している。
そのため、これらの手法は、これらのタスクに存在する限られたデータから最良の意味情報を抽出することができない。
本稿では,網膜血管セグメンテーションのための新しいU-NetアーキテクチャであるAttention W-Netを提案する。
laddernetバックボーンを備えたこのアーキテクチャでは、注意ブロックと正規化尺度という2つの大きな貢献があります。
我々のアテンションブロックは、エンコーダ機能を利用して、アップサンプリング中のスキップ接続からエンコーダ機能に応答し、エンコーダ機能とデコーダ機能を追加すると高い互換性が得られます。
当社のレギュラー化対策には、画像の拡張とResNetブロックの変更が含まれています。
これらの追加により、AUCとF1スコアの0.8407と0.9833が観測され、LadderNetのバックボーンよりも大幅に改善され、現代の最先端メソッド間の競争性能が向上した。
関連論文リスト
- Enhancing Retinal Vascular Structure Segmentation in Images With a Novel
Design Two-Path Interactive Fusion Module Model [6.392575673488379]
網膜血管セグメンテーションの精度を高めるために設計されたSwin-Res-Netについて紹介する。
Swin-Res-Netは、パーティショニングに変位のあるシフトウィンドウを使用するSwin Transformerを使用している。
提案したアーキテクチャは,他の公開されたモデルに適合するか,あるいは超越するかという,優れた結果をもたらす。
論文 参考訳(メタデータ) (2024-03-03T01:36:11Z) - NAC-TCN: Temporal Convolutional Networks with Causal Dilated
Neighborhood Attention for Emotion Understanding [60.74434735079253]
畳み込みTCN(NAC-TCN)を用いた近傍注意法を提案する。
これを実現するために、Dilated Neighborhood Attentionの因果バージョンを導入し、畳み込みを組み込んだ。
我々のモデルは、標準的な感情認識データセットに少ないパラメータを必要としながら、TCN、TCL、LSTM、GRUに匹敵する、より優れた、あるいは最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-12-12T18:41:30Z) - EAA-Net: Rethinking the Autoencoder Architecture with Intra-class
Features for Medical Image Segmentation [4.777011444412729]
We propose a light-weight end-to-end segmentation framework based on multi-task learning, called Edge Attention autoencoder Network (EAA-Net)。
提案手法は,クラス間特徴の抽出にセグメンテーションネットワークを利用するだけでなく,フォアグラウンド内でのクラス内特徴の抽出にも再構成ネットワークを適用する。
実験結果から,医用画像分割作業において,本手法が良好に機能することが確認された。
論文 参考訳(メタデータ) (2022-08-19T07:42:55Z) - SoftPool++: An Encoder-Decoder Network for Point Cloud Completion [93.54286830844134]
本稿では,ポイントクラウド完了作業のための新しい畳み込み演算子を提案する。
提案した演算子は、最大プールやボキセル化操作を一切必要としない。
提案手法は,低解像度・高解像度の形状仕上げにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2022-05-08T15:31:36Z) - PlutoNet: An Efficient Polyp Segmentation Network with Modified Partial
Decoder and Decoder Consistency Training [0.40611352512781856]
PlutoNetは2,626,537のパラメータしか必要とせず、そのパラメータの10%以下である。
修正部分復号器と補助復号器を併用して訓練し、整合性を強化し、エンコーダ表現の改善に役立てる。
我々は、PlutoNetが最先端のモデルよりも優れていることを示すアブレーション研究と広範な実験を行った。
論文 参考訳(メタデータ) (2022-04-06T20:29:00Z) - Crosslink-Net: Double-branch Encoder Segmentation Network via Fusing
Vertical and Horizontal Convolutions [58.71117402626524]
医用画像分割のための新しいダブルブランチエンコーダアーキテクチャを提案する。
1)正方形畳み込みカーネルによる特徴の識別をさらに改善する必要があるため,非正方形および水平畳み込みカーネルの利用を提案する。
実験では,4つのデータセット上でのモデルの有効性を検証した。
論文 参考訳(メタデータ) (2021-07-24T02:58:32Z) - Boundary-Aware Segmentation Network for Mobile and Web Applications [60.815545591314915]
境界認識ネットワーク(basnet)は、精度の高い画像分割のための予測再定義アーキテクチャとハイブリッド損失と統合されている。
basnetは単一のgpu上で70fps以上動作し、多くの潜在的なアプリケーションが利用できる。
BASNetをベースに、BASNetが「COPY」と「PASTING」現実世界のオブジェクトのための拡張現実であるAR COPY & PASTEと、オブジェクト背景の自動削除のためのWebベースのツールであるOBJECT CUTの2つの(近い)商用アプリケーションをさらに開発しました。
論文 参考訳(メタデータ) (2021-01-12T19:20:26Z) - Multi-stage Attention ResU-Net for Semantic Segmentation of
Fine-Resolution Remote Sensing Images [9.398340832493457]
この問題に対処するための線形注意機構(LAM)を提案する。
LAMは、計算効率の高いドット積アテンションとほぼ同値である。
微細なリモートセンシング画像からのセマンティックセグメンテーションのためのマルチステージアテンションResU-Netを設計する。
論文 参考訳(メタデータ) (2020-11-29T07:24:21Z) - Unsupervised Monocular Depth Learning with Integrated Intrinsics and
Spatio-Temporal Constraints [61.46323213702369]
本研究は,大規模深度マップとエゴモーションを予測可能な教師なし学習フレームワークを提案する。
本結果は,KITTI運転データセットの複数シーケンスにおける現在の最先端技術と比較して,高い性能を示す。
論文 参考訳(メタデータ) (2020-11-02T22:26:58Z) - Suppress and Balance: A Simple Gated Network for Salient Object
Detection [89.88222217065858]
両問題を同時に解くための単純なゲートネットワーク(GateNet)を提案する。
多レベルゲートユニットの助けを借りて、エンコーダからの貴重なコンテキスト情報をデコーダに最適に送信することができる。
さらに,提案したFold-ASPP操作(Fold-ASPP)に基づくアトラス空間ピラミッドプーリングを用いて,様々なスケールのサリアンオブジェクトを正確に位置決めする。
論文 参考訳(メタデータ) (2020-07-16T02:00:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。