論文の概要: DeepPyram: Enabling Pyramid View and Deformable Pyramid Reception for
Semantic Segmentation in Cataract Surgery Videos
- arxiv url: http://arxiv.org/abs/2109.05352v1
- Date: Sat, 11 Sep 2021 19:31:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-14 16:00:38.222252
- Title: DeepPyram: Enabling Pyramid View and Deformable Pyramid Reception for
Semantic Segmentation in Cataract Surgery Videos
- Title(参考訳): DeepPyram:白内障手術ビデオにおけるセマンティックセグメンテーションのためのピラミッドビューと変形可能なピラミッドレセプション
- Authors: Negin Ghamsarian, Mario Taschwer, and klaus Schoeffmann
- Abstract要約: 本稿では,DeepPyramと呼ばれるセマンティックセグメンテーションネットワークを提案する。
白内障手術ビデオにおける関連物体のセグメント化において,様々な問題で優れた性能を得ることができる。
提案手法は,4つの白内障手術データセットを用いて,異なる文脈特徴を持つ対象に対して評価する。
- 参考スコア(独自算出の注目度): 7.903979532478604
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Semantic segmentation in cataract surgery has a wide range of applications
contributing to surgical outcome enhancement and clinical risk reduction.
However, the varying issues in segmenting the different relevant instances make
the designation of a unique network quite challenging. This paper proposes a
semantic segmentation network termed as DeepPyram that can achieve superior
performance in segmenting relevant objects in cataract surgery videos with
varying issues. This superiority mainly originates from three modules: (i)
Pyramid View Fusion, which provides a varying-angle global view of the
surrounding region centering at each pixel position in the input convolutional
feature map; (ii) Deformable Pyramid Reception, which enables a wide deformable
receptive field that can adapt to geometric transformations in the object of
interest; and (iii) Pyramid Loss that adaptively supervises multi-scale
semantic feature maps. These modules can effectively boost semantic
segmentation performance, especially in the case of transparency,
deformability, scalability, and blunt edges in objects. The proposed approach
is evaluated using four datasets of cataract surgery for objects with different
contextual features and compared with thirteen state-of-the-art segmentation
networks. The experimental results confirm that DeepPyram outperforms the rival
approaches without imposing additional trainable parameters. Our comprehensive
ablation study further proves the effectiveness of the proposed modules.
- Abstract(参考訳): 白内障手術におけるセマンティクスセグメンテーションは、手術結果の増大と臨床リスク低減に寄与する幅広い応用がある。
しかし、異なる関連するインスタンスを分割する際の様々な問題により、ユニークなネットワークの指定は非常に困難である。
本稿では,白内障手術ビデオにおける関連オブジェクトのセグメンテーションにおいて,より優れた性能を達成できる,DeepPyramと呼ばれるセグメンテーションネットワークを提案する。
この優越性は、主に3つのモジュールに由来する。
(i)ピラミッドビュー融合は、入力畳み込み特徴マップにおいて、各画素位置を中心とする周辺領域の変動角大域的ビューを提供する。
(ii)変形可能なピラミッド受信装置であって、対象物の幾何学的変換に適応可能な広い変形可能な受容体を可能にするもの
(iii)マルチスケールな意味的特徴マップを適応的に監督するピラミッドロス。
これらのモジュールは、特に透過性、変形性、スケーラビリティ、オブジェクトの鈍的エッジの場合、セマンティックセグメンテーションのパフォーマンスを効果的に向上させることができる。
提案手法は,異なる特徴を持つ物体に対する白内障手術の4つのデータセットを用いて評価し,13の最先端セグメンテーションネットワークと比較した。
実験の結果、DeepPyramはトレーニング可能なパラメータを追加することなくライバルのアプローチより優れていることが確認された。
包括的アブレーション研究により,提案モジュールの有効性がさらに証明された。
関連論文リスト
- Surgical Scene Segmentation by Transformer With Asymmetric Feature Enhancement [7.150163844454341]
視覚特異的トランスフォーマー法は外科的シーン理解に有望な方法である。
非対称特徴拡張モジュール(TAFE)を用いたトランスフォーマーベースの新しいフレームワークを提案する。
提案手法は, 手術分割作業におけるSOTA法よりも優れており, さらに, 微細な構造認識の能力も証明している。
論文 参考訳(メタデータ) (2024-10-23T07:58:47Z) - Adaptation of Distinct Semantics for Uncertain Areas in Polyp Segmentation [11.646574658785362]
本研究は,ポリプ不確定領域に対する識別意味論の適応という新しいアーキテクチャを提示する。
ADSNetは、未分類の詳細を修正し、最終段階で消滅し、検出されない弱い特徴を回復する。
実験により,ポリプ画像分割作業における他の技術と比較して,セグメンテーション性能が向上することを示す。
論文 参考訳(メタデータ) (2024-05-13T07:41:28Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - DeepPyramid+: Medical Image Segmentation using Pyramid View Fusion and
Deformable Pyramid Reception [6.541613812766445]
本稿では,医療画像や手術ビデオのセグメンテーションにおいて直面するさまざまな課題に対処するネットワークアーキテクチャであるDeepPyramid+を提案する。
提案されたDeepPyramid+には、"Pyramid View Fusion"(PVF)と"Deformable Pyramid Reception"(DPR)という2つの主要なモジュールが含まれている。
DPRは、拡張変形可能な畳み込みを用いた形状およびスケール適応的特徴抽出技術を導入している。
論文 参考訳(メタデータ) (2023-12-06T10:47:11Z) - Self-Supervised Correction Learning for Semi-Supervised Biomedical Image
Segmentation [84.58210297703714]
半教師付きバイオメディカルイメージセグメンテーションのための自己教師付き補正学習パラダイムを提案する。
共有エンコーダと2つの独立デコーダを含むデュアルタスクネットワークを設計する。
異なるタスクのための3つの医用画像分割データセットの実験により,本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2023-01-12T08:19:46Z) - Part-guided Relational Transformers for Fine-grained Visual Recognition [59.20531172172135]
識別的特徴を学習し,特徴変換モジュールとの相関関係を探索するフレームワークを提案する。
提案手法は,3-of-the-levelオブジェクト認識において,部分ブランチの追加に頼らず,最先端の性能に達する。
論文 参考訳(メタデータ) (2022-12-28T03:45:56Z) - DeepPyramid: Enabling Pyramid View and Deformable Pyramid Reception for
Semantic Segmentation in Cataract Surgery Videos [9.00510634152686]
本稿では,DeepPyramidと呼ばれるセマンティックセグメンテーションネットワークを提案する。
これらのモジュールはセマンティックセグメンテーション性能を効果的に向上させることができることを示す。
我々は,本手法が最先端のレベルで動作し,多くの既存手法よりも大きなマージンを持つことを示す。
論文 参考訳(メタデータ) (2022-07-04T14:41:45Z) - ReCal-Net: Joint Region-Channel-Wise Calibrated Network for Semantic
Segmentation in Cataract Surgery Videos [6.364541434977173]
textitReCalモジュールと呼ばれる新しい畳み込みモジュールを提案する。このモジュールは,地域内および地域間距離とチャネル間距離を用いて特徴マップをキャリブレーションすることができる。
また,ReCal-Netと呼ばれるモジュールをベースとした新しいネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-09-25T22:16:18Z) - DONet: Dual Objective Networks for Skin Lesion Segmentation [77.9806410198298]
本稿では,皮膚病変のセグメンテーションを改善するために,Dual Objective Networks (DONet) という,シンプルで効果的なフレームワークを提案する。
我々のDONetは2つの対称デコーダを採用し、異なる目標に近づくための異なる予測を生成する。
皮膚内視鏡画像における多種多様な病変のスケールと形状の課題に対処するために,再帰的コンテキスト符号化モジュール(RCEM)を提案する。
論文 参考訳(メタデータ) (2020-08-19T06:02:46Z) - Feature Pyramid Transformer [121.50066435635118]
我々は、FPT(Feature Pyramid Transformer)と呼ばれる、空間とスケールの双方で完全にアクティブな特徴相互作用を提案する。
FPTは任意の特徴ピラミッドを同じ大きさの他の特徴ピラミッドに変換するが、よりリッチなコンテキストを持つ。
我々は、インスタンスレベル(オブジェクト検出とインスタンスセグメンテーション)とピクセルレベルのセグメンテーションタスクの両方で広範な実験を行う。
論文 参考訳(メタデータ) (2020-07-18T15:16:32Z) - Adaptive feature recombination and recalibration for semantic
segmentation with Fully Convolutional Networks [57.64866581615309]
完全畳み込みネットワークを用いたセマンティックセグメンテーションに適応した特徴の組換えと空間適応型再分類ブロックを提案する。
その結果、再結合と再校正は競争ベースラインの結果を改善し、3つの異なる問題にまたがって一般化することを示した。
論文 参考訳(メタデータ) (2020-06-19T15:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。