論文の概要: Deep Co-supervision and Attention Fusion Strategy for Automatic COVID-19
Lung Infection Segmentation on CT Images
- arxiv url: http://arxiv.org/abs/2112.10368v1
- Date: Mon, 20 Dec 2021 07:32:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-21 17:54:31.007378
- Title: Deep Co-supervision and Attention Fusion Strategy for Automatic COVID-19
Lung Infection Segmentation on CT Images
- Title(参考訳): CT画像を用いたCOVID-19自動肺感染症分離のための深部コスーパービジョンと注意融合戦略
- Authors: Haigen Hu, Leizhao Shen, Qiu Guan, Xiaoxin Li, Qianwei Zhou and Su
Ruan
- Abstract要約: 本稿では,CT画像上でのCOVID-19感染に対する新たなセグメンテーション手法を提案する。
エッジとセマンティクスの特徴をネットワークで学習する上での深い協調管理手法を提案する。
提案手法の有効性は, 新型コロナウイルスの4つのCTデータセットで実証された。
- 参考スコア(独自算出の注目度): 1.898617934078969
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Due to the irregular shapes,various sizes and indistinguishable boundaries
between the normal and infected tissues, it is still a challenging task to
accurately segment the infected lesions of COVID-19 on CT images. In this
paper, a novel segmentation scheme is proposed for the infections of COVID-19
by enhancing supervised information and fusing multi-scale feature maps of
different levels based on the encoder-decoder architecture. To this end, a deep
collaborative supervision (Co-supervision) scheme is proposed to guide the
network learning the features of edges and semantics. More specifically, an
Edge Supervised Module (ESM) is firstly designed to highlight low-level
boundary features by incorporating the edge supervised information into the
initial stage of down-sampling. Meanwhile, an Auxiliary Semantic Supervised
Module (ASSM) is proposed to strengthen high-level semantic information by
integrating mask supervised information into the later stage. Then an Attention
Fusion Module (AFM) is developed to fuse multiple scale feature maps of
different levels by using an attention mechanism to reduce the semantic gaps
between high-level and low-level feature maps. Finally, the effectiveness of
the proposed scheme is demonstrated on four various COVID-19 CT datasets. The
results show that the proposed three modules are all promising. Based on the
baseline (ResUnet), using ESM, ASSM, or AFM alone can respectively increase
Dice metric by 1.12\%, 1.95\%,1.63\% in our dataset, while the integration by
incorporating three models together can rise 3.97\%. Compared with the existing
approaches in various datasets, the proposed method can obtain better
segmentation performance in some main metrics, and can achieve the best
generalization and comprehensive performance.
- Abstract(参考訳): 異常な形状、さまざまな大きさ、正常組織と感染組織の境界の区別が難しいため、CT画像上でCOVID-19の感染病変を正確に分類することは依然として難しい課題である。
本稿では,エンコーダ・デコーダ・アーキテクチャに基づいて,教師情報を強化し,異なるレベルのマルチスケール特徴マップを融合することにより,新型コロナウイルスの感染症に対する新たなセグメンテーション手法を提案する。
この目的のために,エッジとセマンティクスの特徴をネットワークで学習する上で,協調的監視(コスーパービジョン)手法を提案する。
より具体的には、edge supervised module (esm) はまず、edge supervised情報をダウンサンプリングの初期段階に組み込むことで、低レベル境界の特徴を強調するように設計されている。
一方,ASSM (Auxiliary Semantic Supervised Module) は,マスク管理情報を後段に組み込むことで,高度な意味情報を強化するために提案されている。
次に、アテンションフュージョンモジュール(AFM)を開発し、アテンション機構を用いて、高レベルと低レベルの特徴マップ間のセマンティックギャップを低減することにより、異なるレベルの複数の特徴マップを融合する。
最後に, 提案手法の有効性を, 4つのCOVID-19 CTデータセットで実証した。
その結果,提案する3つのモジュールはすべて有望であることがわかった。
ベースライン(ResUnet)に基づいて、ESM、ASSM、AFMのみを使用して、データセットのDiceメトリックを1.12\%、 1.95\%、1.63\%増加させることができる。
各種データセットの既存手法と比較して,提案手法はいくつかの主要な指標においてセグメンテーション性能が向上し,最高の一般化と包括的性能が得られる。
関連論文リスト
- A Mutual Inclusion Mechanism for Precise Boundary Segmentation in Medical Images [2.9137615132901704]
医用画像の正確な境界セグメンテーションのための新しい深層学習手法MIPC-Netを提案する。
位置特徴抽出時のチャネル情報に重点を置くMIPCモジュールを提案する。
また,エンコーダとデコーダの統合性を高めるグローバルな残差接続であるGL-MIPC-Residueを提案する。
論文 参考訳(メタデータ) (2024-04-12T02:14:35Z) - SDR-Former: A Siamese Dual-Resolution Transformer for Liver Lesion
Classification Using 3D Multi-Phase Imaging [59.78761085714715]
本研究は肝病変分類のための新しいSDR-Formerフレームワークを提案する。
提案フレームワークは2つの臨床データセットに関する総合的な実験を通じて検証された。
科学コミュニティを支援するため,肝病変解析のための多段階MRデータセットを公開しています。
論文 参考訳(メタデータ) (2024-02-27T06:32:56Z) - Generalizable Entity Grounding via Assistance of Large Language Model [77.07759442298666]
本稿では,長いキャプションから密接な視覚的実体を抽出する手法を提案する。
本研究では,意味代名詞の抽出に大規模なマルチモーダルモデル,エンティティレベルのセグメンテーションを生成するクラス-aセグメンテーションモデル,および各セグメンテーション名詞と対応するセグメンテーションマスクを関連付けるマルチモーダル特徴融合モジュールを利用する。
論文 参考訳(メタデータ) (2024-02-04T16:06:05Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - MLF-DET: Multi-Level Fusion for Cross-Modal 3D Object Detection [54.52102265418295]
MLF-DETと呼ばれる,高性能なクロスモーダル3DオブジェクトDrectionのための,新規かつ効果的なマルチレベルフュージョンネットワークを提案する。
特徴レベルの融合では、マルチスケールのボクセル特徴と画像の特徴を密集したマルチスケールのボクセル画像融合(MVI)モジュールを提示する。
本稿では,画像のセマンティクスを利用して検出候補の信頼度を補正するFCR(Feature-cued Confidence Rectification)モジュールを提案する。
論文 参考訳(メタデータ) (2023-07-18T11:26:02Z) - Superresolution and Segmentation of OCT scans using Multi-Stage
adversarial Guided Attention Training [18.056525121226862]
我々は,OCTスキャンを高分解能セグメンテーションラベルに変換する多段階・多識別型生成逆数ネットワーク(MultiSDGAN)を提案する。
我々は,MultiSDGANアーキテクチャに対して,チャネルと空間的注意の様々な組み合わせを評価し,比較し,より強力な特徴マップを抽出する。
その結果,Dice係数とSSIMでは21.44%,19.45%の相対的な改善が見られた。
論文 参考訳(メタデータ) (2022-06-10T00:26:55Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - TC-Net: Triple Context Network for Automated Stroke Lesion Segmentation [0.5482532589225552]
本稿では,空間的コンテキスト情報を中心として,新たなネットワークである Triple Context Network (TC-Net) を提案する。
我々のネットワークはオープンデータセットATLASで評価され、最高スコアは0.594、ハウスドルフ距離は27.005mm、平均対称性表面距離は7.137mmである。
論文 参考訳(メタデータ) (2022-02-28T11:12:16Z) - Deep Attention-guided Graph Clustering with Dual Self-supervision [49.040136530379094]
デュアル・セルフ・スーパービジョン(DAGC)を用いたディープアテンション誘導グラフクラスタリング法を提案する。
我々は,三重項Kulback-Leibler分散損失を持つソフトな自己スーパービジョン戦略と,擬似的な監督損失を持つハードな自己スーパービジョン戦略からなる二重自己スーパービジョンソリューションを開発する。
提案手法は6つのベンチマークデータセットにおける最先端の手法より一貫して優れている。
論文 参考訳(メタデータ) (2021-11-10T06:53:03Z) - PAENet: A Progressive Attention-Enhanced Network for 3D to 2D Retinal
Vessel Segmentation [0.0]
光コヒーレンス・トモグラフィー(OCTA)画像では3次元から2次元の網膜血管セグメンテーションは難しい問題である。
本稿では,多機能表現を抽出するアテンション機構に基づくプログレッシブ・アテンション・エンハンスメント・ネットワーク(PAENet)を提案する。
提案アルゴリズムは,従来の手法と比較して最先端性能を実現する。
論文 参考訳(メタデータ) (2021-08-26T10:27:25Z) - MPG-Net: Multi-Prediction Guided Network for Segmentation of Retinal
Layers in OCT Images [11.370735571629602]
OCT画像の自動網膜層分割のための新しいマルチプレディション誘導アテンションネットワーク(MPG-Net)を提案する。
MPG-Netは、信頼性の高い自動セグメンテーションのためのU字形完全畳み込みネットワーク(FCN)の識別力を強化する2つの主要なステップから構成される。
論文 参考訳(メタデータ) (2020-09-28T21:22:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。