論文の概要: DeepPyramid+: Medical Image Segmentation using Pyramid View Fusion and
Deformable Pyramid Reception
- arxiv url: http://arxiv.org/abs/2312.03409v1
- Date: Wed, 6 Dec 2023 10:47:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-07 15:07:12.584262
- Title: DeepPyramid+: Medical Image Segmentation using Pyramid View Fusion and
Deformable Pyramid Reception
- Title(参考訳): DeepPyramid+: ピラミッド視融合と変形可能なピラミッド受容を用いた医用画像分割
- Authors: Negin Ghamsarian, Sebastian Wolf, Martin Zinkernagel, Klaus
Schoeffmann, Raphael Sznitman
- Abstract要約: 本稿では,医療画像や手術ビデオのセグメンテーションにおいて直面するさまざまな課題に対処するネットワークアーキテクチャであるDeepPyramid+を提案する。
提案されたDeepPyramid+には、"Pyramid View Fusion"(PVF)と"Deformable Pyramid Reception"(DPR)という2つの主要なモジュールが含まれている。
DPRは、拡張変形可能な畳み込みを用いた形状およびスケール適応的特徴抽出技術を導入している。
- 参考スコア(独自算出の注目度): 6.541613812766445
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Semantic Segmentation plays a pivotal role in many applications related to
medical image and video analysis. However, designing a neural network
architecture for medical image and surgical video segmentation is challenging
due to the diverse features of relevant classes, including heterogeneity,
deformability, transparency, blunt boundaries, and various distortions. We
propose a network architecture, DeepPyramid+, which addresses diverse
challenges encountered in medical image and surgical video segmentation. The
proposed DeepPyramid+ incorporates two major modules, namely "Pyramid View
Fusion" (PVF) and "Deformable Pyramid Reception," (DPR), to address the
outlined challenges. PVF replicates a deduction process within the neural
network, aligning with the human visual system, thereby enhancing the
representation of relative information at each pixel position. Complementarily,
DPR introduces shape- and scale-adaptive feature extraction techniques using
dilated deformable convolutions, enhancing accuracy and robustness in handling
heterogeneous classes and deformable shapes. Extensive experiments conducted on
diverse datasets, including endometriosis videos, MRI images, OCT scans, and
cataract and laparoscopy videos, demonstrate the effectiveness of DeepPyramid+
in handling various challenges such as shape and scale variation, reflection,
and blur degradation. DeepPyramid+ demonstrates significant improvements in
segmentation performance, achieving up to a 3.65% increase in Dice coefficient
for intra-domain segmentation and up to a 17% increase in Dice coefficient for
cross-domain segmentation. DeepPyramid+ consistently outperforms
state-of-the-art networks across diverse modalities considering different
backbone networks, showcasing its versatility.
- Abstract(参考訳): セマンティックセグメンテーションは、医療画像やビデオ分析に関連する多くのアプリケーションにおいて重要な役割を果たす。
しかし,異質性,変形性,透明性,鈍的境界,様々な歪みなど,関連するクラスの多様な特徴から,医用画像や手術用ビデオセグメンテーションのためのニューラルネットワークアーキテクチャの設計は困難である。
医用画像や手術用ビデオセグメンテーションで遭遇するさまざまな課題に対処するネットワークアーキテクチャであるdeeppyramid+を提案する。
提案されたDeepPyramid+には、2つの主要なモジュール、すなわち"Pyramid View Fusion"(PVF)と"Deformable Pyramid Reception"(DPR)が組み込まれている。
PVFは、人間の視覚システムと整合して、ニューラルネットワーク内の推論プロセスを複製し、各画素位置における相対情報の表現を強化する。
相補的に、DPRは拡張変形可能な畳み込みを用いた形状適応的特徴抽出技術を導入し、不均一なクラスや変形可能な形状を扱う際の精度と堅牢性を向上する。
子宮内膜症ビデオ、MRI画像、CTスキャン、白内障および腹腔鏡ビデオなど、さまざまなデータセットで実施された大規模な実験は、形状やスケールの変化、反射、ぼやけた劣化といった様々な課題にDeepPyramid+の有効性を実証している。
deeppyramid+は、ドメイン内セグメンテーションでdice係数を3.65%、クロスドメインセグメンテーションでdice係数を17%向上させ、セグメンテーション性能が大幅に向上している。
DeepPyramid+は、さまざまなバックボーンネットワークを考慮して、さまざまなモダリティの最先端ネットワークを一貫して上回り、その汎用性を示している。
関連論文リスト
- TransResNet: Integrating the Strengths of ViTs and CNNs for High Resolution Medical Image Segmentation via Feature Grafting [6.987177704136503]
医用画像領域で高解像度画像が好ましいのは、基礎となる方法の診断能力を大幅に向上させるためである。
医用画像セグメンテーションのための既存のディープラーニング技術のほとんどは、空間次元が小さい入力画像に最適化されており、高解像度画像では不十分である。
我々はTransResNetという並列処理アーキテクチャを提案し、TransformerとCNNを並列的に組み合わせ、マルチ解像度画像から特徴を独立して抽出する。
論文 参考訳(メタデータ) (2024-10-01T18:22:34Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - M$^{2}$SNet: Multi-scale in Multi-scale Subtraction Network for Medical
Image Segmentation [73.10707675345253]
医用画像から多様なセグメンテーションを仕上げるマルチスケールサブトラクションネットワーク(M$2$SNet)を提案する。
本手法は,4つの異なる医用画像セグメンテーションタスクの11つのデータセットに対して,異なる評価基準の下で,ほとんどの最先端手法に対して好意的に機能する。
論文 参考訳(メタデータ) (2023-03-20T06:26:49Z) - Self-Supervised Correction Learning for Semi-Supervised Biomedical Image
Segmentation [84.58210297703714]
半教師付きバイオメディカルイメージセグメンテーションのための自己教師付き補正学習パラダイムを提案する。
共有エンコーダと2つの独立デコーダを含むデュアルタスクネットワークを設計する。
異なるタスクのための3つの医用画像分割データセットの実験により,本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2023-01-12T08:19:46Z) - Affinity Feature Strengthening for Accurate, Complete and Robust Vessel
Segmentation [48.638327652506284]
血管セグメンテーションは、冠動脈狭窄、網膜血管疾患、脳動脈瘤などの多くの医学的応用において重要である。
コントラストに敏感なマルチスケールアフィニティアプローチを用いて,幾何学的手法と画素単位のセグメンテーション特徴を連成的にモデル化する新しいアプローチであるAFNを提案する。
論文 参考訳(メタデータ) (2022-11-12T05:39:17Z) - DeepPyramid: Enabling Pyramid View and Deformable Pyramid Reception for
Semantic Segmentation in Cataract Surgery Videos [9.00510634152686]
本稿では,DeepPyramidと呼ばれるセマンティックセグメンテーションネットワークを提案する。
これらのモジュールはセマンティックセグメンテーション性能を効果的に向上させることができることを示す。
我々は,本手法が最先端のレベルで動作し,多くの既存手法よりも大きなマージンを持つことを示す。
論文 参考訳(メタデータ) (2022-07-04T14:41:45Z) - DeepPyram: Enabling Pyramid View and Deformable Pyramid Reception for
Semantic Segmentation in Cataract Surgery Videos [7.903979532478604]
本稿では,DeepPyramと呼ばれるセマンティックセグメンテーションネットワークを提案する。
白内障手術ビデオにおける関連物体のセグメント化において,様々な問題で優れた性能を得ることができる。
提案手法は,4つの白内障手術データセットを用いて,異なる文脈特徴を持つ対象に対して評価する。
論文 参考訳(メタデータ) (2021-09-11T19:31:52Z) - (M)SLAe-Net: Multi-Scale Multi-Level Attention embedded Network for
Retinal Vessel Segmentation [0.0]
マルチステージ処理の課題に対処するため,マルチスケールでマルチレベルなCNNアーキテクチャ((M)SLAe-Net)を提案する。
我々は、複数のスケールとネットワークの複数のレベルの特徴を抽出することで、我々のモデルが局所的およびグローバル的特徴を全体的に抽出することを可能にする。
D-DPPモジュールは細管に効率よくタスク特異的な損失機能を持たせることで,クロスデータ性能の向上を実現した。
論文 参考訳(メタデータ) (2021-09-05T14:29:00Z) - Contextual Information Enhanced Convolutional Neural Networks for
Retinal Vessel Segmentation in Color Fundus Images [0.0]
自動網膜血管セグメンテーションシステムは、臨床診断及び眼科研究を効果的に促進することができる。
ディープラーニングベースの手法が提案され、いくつかのカスタマイズされたモジュールが有名なエンコーダデコーダアーキテクチャU-netに統合されている。
その結果,提案手法は先行技術よりも優れ,感性/リコール,F1スコア,MCCの最先端性能を実現している。
論文 参考訳(メタデータ) (2021-03-25T06:10:47Z) - Medical Transformer: Gated Axial-Attention for Medical Image
Segmentation [73.98974074534497]
医用画像分割タスクにおけるトランスフォーマティブネットワークアーキテクチャの利用可能性について検討する。
セルフアテンションモジュールに追加の制御機構を導入することで,既存のアーキテクチャを拡張するGated Axial-Attentionモデルを提案する。
医療画像上で効果的にモデルを訓練するために,さらにパフォーマンスを向上させる局所的グローバルトレーニング戦略 (logo) を提案する。
論文 参考訳(メタデータ) (2021-02-21T18:35:14Z) - Pathological Retinal Region Segmentation From OCT Images Using Geometric
Relation Based Augmentation [84.7571086566595]
本稿では,幾何学と形状の内在的関係を共同で符号化することで,従来のGANベースの医用画像合成法よりも優れた手法を提案する。
提案手法は,取得手順の異なる画像を有する公開RETOUCHデータセット上で,最先端のセグメンテーション手法より優れている。
論文 参考訳(メタデータ) (2020-03-31T11:50:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。