論文の概要: DeepPyramid: Enabling Pyramid View and Deformable Pyramid Reception for
Semantic Segmentation in Cataract Surgery Videos
- arxiv url: http://arxiv.org/abs/2207.01453v1
- Date: Mon, 4 Jul 2022 14:41:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-05 15:10:23.762900
- Title: DeepPyramid: Enabling Pyramid View and Deformable Pyramid Reception for
Semantic Segmentation in Cataract Surgery Videos
- Title(参考訳): DeepPyramid:白内障手術ビデオにおけるセマンティックセグメンテーションのためのピラミッド視と変形可能なピラミッド受容
- Authors: Negin Ghamsarian, Mario Taschwer, Raphael Sznitman, Klaus Schoeffmann
- Abstract要約: 本稿では,DeepPyramidと呼ばれるセマンティックセグメンテーションネットワークを提案する。
これらのモジュールはセマンティックセグメンテーション性能を効果的に向上させることができることを示す。
我々は,本手法が最先端のレベルで動作し,多くの既存手法よりも大きなマージンを持つことを示す。
- 参考スコア(独自算出の注目度): 9.00510634152686
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Semantic segmentation in cataract surgery has a wide range of applications
contributing to surgical outcome enhancement and clinical risk reduction.
However, the varying issues in segmenting the different relevant structures in
these surgeries make the designation of a unique network quite challenging.
This paper proposes a semantic segmentation network, termed DeepPyramid, that
can deal with these challenges using three novelties: (1) a Pyramid View Fusion
module which provides a varying-angle global view of the surrounding region
centering at each pixel position in the input convolutional feature map; (2) a
Deformable Pyramid Reception module which enables a wide deformable receptive
field that can adapt to geometric transformations in the object of interest;
and (3) a dedicated Pyramid Loss that adaptively supervises multi-scale
semantic feature maps. Combined, we show that these modules can effectively
boost semantic segmentation performance, especially in the case of
transparency, deformability, scalability, and blunt edges in objects. We
demonstrate that our approach performs at a state-of-the-art level and
outperforms a number of existing methods with a large margin (3.66% overall
improvement in intersection over union compared to the best rival approach).
- Abstract(参考訳): 白内障手術におけるセマンティクスセグメンテーションは、手術結果の増大と臨床リスク低減に寄与する幅広い応用がある。
しかし、これらの手術で異なる関連構造を分割する際の様々な問題は、ユニークなネットワークの指定を非常に困難にしている。
This paper proposes a semantic segmentation network, termed DeepPyramid, that can deal with these challenges using three novelties: (1) a Pyramid View Fusion module which provides a varying-angle global view of the surrounding region centering at each pixel position in the input convolutional feature map; (2) a Deformable Pyramid Reception module which enables a wide deformable receptive field that can adapt to geometric transformations in the object of interest; and (3) a dedicated Pyramid Loss that adaptively supervises multi-scale semantic feature maps.
これらのモジュールを組み合わせることで、特に透明性、変形性、スケーラビリティ、オブジェクトの鈍いエッジにおいて、セマンティックセグメンテーションのパフォーマンスを効果的に向上できることを示す。
我々は、我々のアプローチが最先端のレベルで実行され、多くの既存の手法よりも大きなマージン(3.66%)で、最も競合するアプローチと比較して、ユニオンよりも全体的な改善を達成していることを示した。
関連論文リスト
- Adaptation of Distinct Semantics for Uncertain Areas in Polyp Segmentation [11.646574658785362]
本研究は,ポリプ不確定領域に対する識別意味論の適応という新しいアーキテクチャを提示する。
ADSNetは、未分類の詳細を修正し、最終段階で消滅し、検出されない弱い特徴を回復する。
実験により,ポリプ画像分割作業における他の技術と比較して,セグメンテーション性能が向上することを示す。
論文 参考訳(メタデータ) (2024-05-13T07:41:28Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - DeepPyramid+: Medical Image Segmentation using Pyramid View Fusion and
Deformable Pyramid Reception [6.541613812766445]
本稿では,医療画像や手術ビデオのセグメンテーションにおいて直面するさまざまな課題に対処するネットワークアーキテクチャであるDeepPyramid+を提案する。
提案されたDeepPyramid+には、"Pyramid View Fusion"(PVF)と"Deformable Pyramid Reception"(DPR)という2つの主要なモジュールが含まれている。
DPRは、拡張変形可能な畳み込みを用いた形状およびスケール適応的特徴抽出技術を導入している。
論文 参考訳(メタデータ) (2023-12-06T10:47:11Z) - Edge-aware Feature Aggregation Network for Polyp Segmentation [40.3881565207086]
本研究では,ポリプセグメンテーションのためのエッジ対応特徴集約ネットワーク(EFA-Net)を提案する。
EFA-Netは、ポリプセグメンテーションの性能を高めるために、クロスレベルとマルチスケールの機能を完全に活用することができる。
広く採用されている5つの大腸内視鏡データセットの実験結果から,我々のEFA-Netは,一般化と有効性の観点から,最先端のポリプセグメンテーション法より優れていることが示された。
論文 参考訳(メタデータ) (2023-09-19T11:09:38Z) - SegT: A Novel Separated Edge-guidance Transformer Network for Polyp
Segmentation [10.144870911523622]
本稿では, 効率的なポリープ分割モデルを構築することを目的とした, エッジ誘導変換器 (SegT) ネットワークを提案する。
既存のCNNベースのアプローチよりも堅牢な表現を学習するトランスフォーマーエンコーダが特に適用された。
SegTの有効性を評価するために、5つの挑戦的な公開データセットを用いて実験を行った。
論文 参考訳(メタデータ) (2023-06-19T08:32:05Z) - Part-guided Relational Transformers for Fine-grained Visual Recognition [59.20531172172135]
識別的特徴を学習し,特徴変換モジュールとの相関関係を探索するフレームワークを提案する。
提案手法は,3-of-the-levelオブジェクト認識において,部分ブランチの追加に頼らず,最先端の性能に達する。
論文 参考訳(メタデータ) (2022-12-28T03:45:56Z) - Feedback Chain Network For Hippocampus Segmentation [59.74305660815117]
海馬セグメンテーションタスクのための階層型フィードバックチェーンネットワークを提案する。
提案手法は,3つの公開データセット上での最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-11-15T04:32:10Z) - Behind Every Domain There is a Shift: Adapting Distortion-aware Vision Transformers for Panoramic Semantic Segmentation [73.48323921632506]
パノラマ的セマンティックセマンティックセグメンテーションは2つの重要な課題により未探索である。
まず、変形性パッチ埋め込み(DPE)と変形性(DMLPv2)モジュールを備えたパノラマセマンティックトランス4PASS+を改良したトランスフォーマーを提案する。
第2に、教師なしドメイン適応パノラマセグメンテーションのための擬似ラベル修正により、Mutual Prototypeal Adaptation(MPA)戦略を強化する。
第3に、Pinhole-to-Panoramic(Pin2Pan)適応とは別に、9,080パノラマ画像を用いた新しいデータセット(SynPASS)を作成します。
論文 参考訳(メタデータ) (2022-07-25T00:42:38Z) - DeepPyram: Enabling Pyramid View and Deformable Pyramid Reception for
Semantic Segmentation in Cataract Surgery Videos [7.903979532478604]
本稿では,DeepPyramと呼ばれるセマンティックセグメンテーションネットワークを提案する。
白内障手術ビデオにおける関連物体のセグメント化において,様々な問題で優れた性能を得ることができる。
提案手法は,4つの白内障手術データセットを用いて,異なる文脈特徴を持つ対象に対して評価する。
論文 参考訳(メタデータ) (2021-09-11T19:31:52Z) - Feature Pyramid Transformer [121.50066435635118]
我々は、FPT(Feature Pyramid Transformer)と呼ばれる、空間とスケールの双方で完全にアクティブな特徴相互作用を提案する。
FPTは任意の特徴ピラミッドを同じ大きさの他の特徴ピラミッドに変換するが、よりリッチなコンテキストを持つ。
我々は、インスタンスレベル(オブジェクト検出とインスタンスセグメンテーション)とピクセルレベルのセグメンテーションタスクの両方で広範な実験を行う。
論文 参考訳(メタデータ) (2020-07-18T15:16:32Z) - Feature Pyramid Grids [140.11116687047058]
本稿では,深い多経路特徴ピラミッドであるFeature Pyramid Grids (FPG)を提案する。
FPGは、同様の計算コストで性能を大幅に向上させることで、シングルパスの特徴ピラミッドネットワークを改善することができる。
論文 参考訳(メタデータ) (2020-04-07T17:59:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。