論文の概要: Crosslink-Net: Double-branch Encoder Segmentation Network via Fusing
Vertical and Horizontal Convolutions
- arxiv url: http://arxiv.org/abs/2107.11517v1
- Date: Sat, 24 Jul 2021 02:58:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-27 16:25:12.789483
- Title: Crosslink-Net: Double-branch Encoder Segmentation Network via Fusing
Vertical and Horizontal Convolutions
- Title(参考訳): Crosslink-Net:垂直および水平の畳み込みによるダブルブランチエンコーダセグメンテーションネットワーク
- Authors: Qian Yu, Lei Qi, Luping Zhou, Lei Wang, Yilong Yin, Yinghuan Shi,
Wuzhang Wang, Yang Gao
- Abstract要約: 医用画像分割のための新しいダブルブランチエンコーダアーキテクチャを提案する。
1)正方形畳み込みカーネルによる特徴の識別をさらに改善する必要があるため,非正方形および水平畳み込みカーネルの利用を提案する。
実験では,4つのデータセット上でのモデルの有効性を検証した。
- 参考スコア(独自算出の注目度): 58.71117402626524
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate image segmentation plays a crucial role in medical image analysis,
yet it faces great challenges of various shapes, diverse sizes, and blurry
boundaries. To address these difficulties, square kernel-based encoder-decoder
architecture has been proposed and widely used, but its performance remains
still unsatisfactory. To further cope with these challenges, we present a novel
double-branch encoder architecture. Our architecture is inspired by two
observations: 1) Since the discrimination of features learned via square
convolutional kernels needs to be further improved, we propose to utilize
non-square vertical and horizontal convolutional kernels in the double-branch
encoder, so features learned by the two branches can be expected to complement
each other. 2) Considering that spatial attention can help models to better
focus on the target region in a large-sized image, we develop an attention loss
to further emphasize the segmentation on small-sized targets. Together, the
above two schemes give rise to a novel double-branch encoder segmentation
framework for medical image segmentation, namely Crosslink-Net. The experiments
validate the effectiveness of our model on four datasets. The code is released
at https://github.com/Qianyu1226/Crosslink-Net.
- Abstract(参考訳): 正確な画像分割は医用画像解析において重要な役割を果たすが、様々な形状や大きさ、ぼやけた境界といった大きな課題に直面している。
これらの問題に対処するために、正方形カーネルベースのエンコーダ-デコーダアーキテクチャが提案され、広く使用されているが、その性能はまだ不十分である。
これらの課題にさらに対処すべく,新しいダブルブランチエンコーダアーキテクチャを提案する。
1) 正方形畳み込み型カーネルで学習した特徴の識別をさらに改善する必要があるため, 二重分岐エンコーダにおける非正方形垂直および水平畳み込み型カーネルの利用を提案する。
2) 空間的注意が大規模画像のターゲット領域により焦点を合わせるのに役立つことを考慮し, 小型画像のセグメンテーションをさらに強調するために, 注意損失を生じさせる。
上記の2つのスキームは、医療画像セグメンテーションのための新しいダブルブランチエンコーダセグメンテーションフレームワークであるCrosslink-Netを生み出している。
実験は、4つのデータセットにおけるモデルの有効性を検証する。
コードはhttps://github.com/qianyu1226/crosslink-netでリリースされる。
関連論文リスト
- Dual-scale Enhanced and Cross-generative Consistency Learning for
Semi-supervised Polyp Segmentation [52.06525450636897]
大腸癌の早期診断と治療において, 自動ポリープセグメンテーションが重要な役割を担っている。
既存の手法は、完全に教師されたトレーニングに大きく依存しており、大量のラベル付きデータと時間を要するピクセル単位のアノテーションを必要とする。
大腸内視鏡画像からの半教師付きポリープ(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learningフレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Triple-View Knowledge Distillation for Semi-Supervised Semantic
Segmentation [54.23510028456082]
半教師付きセマンティックセグメンテーションのためのトリプルビュー知識蒸留フレームワークTriKDを提案する。
このフレームワークは、トリプルビューエンコーダとデュアル周波数デコーダを含む。
論文 参考訳(メタデータ) (2023-09-22T01:02:21Z) - Towards Diverse Binary Segmentation via A Simple yet General Gated Network [71.19503376629083]
本稿では,バイナリセグメンテーションタスクに対処するシンプルな汎用ネットワーク(GateNet)を提案する。
多段ゲートユニットの助けを借りて、エンコーダからの貴重なコンテキスト情報をデコーダに選択的に送信することができる。
我々は,アトーラスの畳み込みを改善し,新規な折り畳み畳み畳み畳み畳み込みを形成する「Fold」操作を導入した。
論文 参考訳(メタデータ) (2023-03-18T11:26:36Z) - LoopITR: Combining Dual and Cross Encoder Architectures for Image-Text
Retrieval [117.15862403330121]
共同学習のためのネットワークにおいて,デュアルエンコーダとクロスエンコーダを組み合わせたLoopITRを提案する。
具体的には、二重エンコーダをクロスエンコーダに強陰性を与え、より識別性の高いクロスエンコーダを用いてその予測を二重エンコーダに戻す。
論文 参考訳(メタデータ) (2022-03-10T16:41:12Z) - Attention W-Net: Improved Skip Connections for better Representations [5.027571997864707]
我々は網膜血管分割のための新しいU-NetアーキテクチャであるAttention W-Netを提案する。
我々はAUCとF1スコアの0.8407と0.9833を観測し、LadderNetのバックボーンを大きく改善した。
論文 参考訳(メタデータ) (2021-10-17T12:44:36Z) - Suppress and Balance: A Simple Gated Network for Salient Object
Detection [89.88222217065858]
両問題を同時に解くための単純なゲートネットワーク(GateNet)を提案する。
多レベルゲートユニットの助けを借りて、エンコーダからの貴重なコンテキスト情報をデコーダに最適に送信することができる。
さらに,提案したFold-ASPP操作(Fold-ASPP)に基づくアトラス空間ピラミッドプーリングを用いて,様々なスケールのサリアンオブジェクトを正確に位置決めする。
論文 参考訳(メタデータ) (2020-07-16T02:00:53Z) - CF2-Net: Coarse-to-Fine Fusion Convolutional Network for Breast
Ultrasound Image Segmentation [14.807364495808779]
BUS画像セグメンテーションのための新しい特徴統合戦略(「E」のような型を生成する)に基づいて、粗大な融合畳み込みネットワーク(CF2-Net)を提案し、評価する。
提案するCF2-Netは4倍のクロスバリデーションを用いてオープンデータセットで評価した。
実験の結果,CF2-Netは,他の深層学習手法と比較して最先端の性能が得られることがわかった。
論文 参考訳(メタデータ) (2020-03-23T09:27:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。