論文の概要: DeepPyram: Enabling Pyramid View and Deformable Pyramid Reception for
Semantic Segmentation in Cataract Surgery Videos
- arxiv url: http://arxiv.org/abs/2109.05352v1
- Date: Sat, 11 Sep 2021 19:31:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-14 16:00:38.222252
- Title: DeepPyram: Enabling Pyramid View and Deformable Pyramid Reception for
Semantic Segmentation in Cataract Surgery Videos
- Title(参考訳): DeepPyram:白内障手術ビデオにおけるセマンティックセグメンテーションのためのピラミッドビューと変形可能なピラミッドレセプション
- Authors: Negin Ghamsarian, Mario Taschwer, and klaus Schoeffmann
- Abstract要約: 本稿では,DeepPyramと呼ばれるセマンティックセグメンテーションネットワークを提案する。
白内障手術ビデオにおける関連物体のセグメント化において,様々な問題で優れた性能を得ることができる。
提案手法は,4つの白内障手術データセットを用いて,異なる文脈特徴を持つ対象に対して評価する。
- 参考スコア(独自算出の注目度): 7.903979532478604
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Semantic segmentation in cataract surgery has a wide range of applications
contributing to surgical outcome enhancement and clinical risk reduction.
However, the varying issues in segmenting the different relevant instances make
the designation of a unique network quite challenging. This paper proposes a
semantic segmentation network termed as DeepPyram that can achieve superior
performance in segmenting relevant objects in cataract surgery videos with
varying issues. This superiority mainly originates from three modules: (i)
Pyramid View Fusion, which provides a varying-angle global view of the
surrounding region centering at each pixel position in the input convolutional
feature map; (ii) Deformable Pyramid Reception, which enables a wide deformable
receptive field that can adapt to geometric transformations in the object of
interest; and (iii) Pyramid Loss that adaptively supervises multi-scale
semantic feature maps. These modules can effectively boost semantic
segmentation performance, especially in the case of transparency,
deformability, scalability, and blunt edges in objects. The proposed approach
is evaluated using four datasets of cataract surgery for objects with different
contextual features and compared with thirteen state-of-the-art segmentation
networks. The experimental results confirm that DeepPyram outperforms the rival
approaches without imposing additional trainable parameters. Our comprehensive
ablation study further proves the effectiveness of the proposed modules.
- Abstract(参考訳): 白内障手術におけるセマンティクスセグメンテーションは、手術結果の増大と臨床リスク低減に寄与する幅広い応用がある。
しかし、異なる関連するインスタンスを分割する際の様々な問題により、ユニークなネットワークの指定は非常に困難である。
本稿では,白内障手術ビデオにおける関連オブジェクトのセグメンテーションにおいて,より優れた性能を達成できる,DeepPyramと呼ばれるセグメンテーションネットワークを提案する。
この優越性は、主に3つのモジュールに由来する。
(i)ピラミッドビュー融合は、入力畳み込み特徴マップにおいて、各画素位置を中心とする周辺領域の変動角大域的ビューを提供する。
(ii)変形可能なピラミッド受信装置であって、対象物の幾何学的変換に適応可能な広い変形可能な受容体を可能にするもの
(iii)マルチスケールな意味的特徴マップを適応的に監督するピラミッドロス。
これらのモジュールは、特に透過性、変形性、スケーラビリティ、オブジェクトの鈍的エッジの場合、セマンティックセグメンテーションのパフォーマンスを効果的に向上させることができる。
提案手法は,異なる特徴を持つ物体に対する白内障手術の4つのデータセットを用いて評価し,13の最先端セグメンテーションネットワークと比較した。
実験の結果、DeepPyramはトレーニング可能なパラメータを追加することなくライバルのアプローチより優れていることが確認された。
包括的アブレーション研究により,提案モジュールの有効性がさらに証明された。
関連論文リスト
- DeepPyramid+: Medical Image Segmentation using Pyramid View Fusion and
Deformable Pyramid Reception [6.541613812766445]
本稿では,医療画像や手術ビデオのセグメンテーションにおいて直面するさまざまな課題に対処するネットワークアーキテクチャであるDeepPyramid+を提案する。
提案されたDeepPyramid+には、"Pyramid View Fusion"(PVF)と"Deformable Pyramid Reception"(DPR)という2つの主要なモジュールが含まれている。
DPRは、拡張変形可能な畳み込みを用いた形状およびスケール適応的特徴抽出技術を導入している。
論文 参考訳(メタデータ) (2023-12-06T10:47:11Z) - Self-Supervised Correction Learning for Semi-Supervised Biomedical Image
Segmentation [84.58210297703714]
半教師付きバイオメディカルイメージセグメンテーションのための自己教師付き補正学習パラダイムを提案する。
共有エンコーダと2つの独立デコーダを含むデュアルタスクネットワークを設計する。
異なるタスクのための3つの医用画像分割データセットの実験により,本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2023-01-12T08:19:46Z) - Part-guided Relational Transformers for Fine-grained Visual Recognition [59.20531172172135]
識別的特徴を学習し,特徴変換モジュールとの相関関係を探索するフレームワークを提案する。
提案手法は,3-of-the-levelオブジェクト認識において,部分ブランチの追加に頼らず,最先端の性能に達する。
論文 参考訳(メタデータ) (2022-12-28T03:45:56Z) - Semantic-SuPer: A Semantic-aware Surgical Perception Framework for
Endoscopic Tissue Classification, Reconstruction, and Tracking [21.133420628173067]
外科的知覚の枠組みであるSemantic-SuPerを提案する。
データアソシエーション、3D再構成、内視鏡的シーンの追跡を容易にするため、幾何学的および意味的な情報を統合する。
論文 参考訳(メタデータ) (2022-10-29T19:33:21Z) - DeepPyramid: Enabling Pyramid View and Deformable Pyramid Reception for
Semantic Segmentation in Cataract Surgery Videos [9.00510634152686]
本稿では,DeepPyramidと呼ばれるセマンティックセグメンテーションネットワークを提案する。
これらのモジュールはセマンティックセグメンテーション性能を効果的に向上させることができることを示す。
我々は,本手法が最先端のレベルで動作し,多くの既存手法よりも大きなマージンを持つことを示す。
論文 参考訳(メタデータ) (2022-07-04T14:41:45Z) - ReCal-Net: Joint Region-Channel-Wise Calibrated Network for Semantic
Segmentation in Cataract Surgery Videos [6.364541434977173]
textitReCalモジュールと呼ばれる新しい畳み込みモジュールを提案する。このモジュールは,地域内および地域間距離とチャネル間距離を用いて特徴マップをキャリブレーションすることができる。
また,ReCal-Netと呼ばれるモジュールをベースとした新しいネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-09-25T22:16:18Z) - Contextual Information Enhanced Convolutional Neural Networks for
Retinal Vessel Segmentation in Color Fundus Images [0.0]
自動網膜血管セグメンテーションシステムは、臨床診断及び眼科研究を効果的に促進することができる。
ディープラーニングベースの手法が提案され、いくつかのカスタマイズされたモジュールが有名なエンコーダデコーダアーキテクチャU-netに統合されている。
その結果,提案手法は先行技術よりも優れ,感性/リコール,F1スコア,MCCの最先端性能を実現している。
論文 参考訳(メタデータ) (2021-03-25T06:10:47Z) - Three Ways to Improve Semantic Segmentation with Self-Supervised Depth
Estimation [90.87105131054419]
ラベルなし画像列からの自己教師付き単眼深度推定により強化された半教師付きセマンティックセマンティックセマンティックセマンティクスのフレームワークを提案する。
提案されたモデルをCityscapesデータセット上で検証する。
論文 参考訳(メタデータ) (2020-12-19T21:18:03Z) - DONet: Dual Objective Networks for Skin Lesion Segmentation [77.9806410198298]
本稿では,皮膚病変のセグメンテーションを改善するために,Dual Objective Networks (DONet) という,シンプルで効果的なフレームワークを提案する。
我々のDONetは2つの対称デコーダを採用し、異なる目標に近づくための異なる予測を生成する。
皮膚内視鏡画像における多種多様な病変のスケールと形状の課題に対処するために,再帰的コンテキスト符号化モジュール(RCEM)を提案する。
論文 参考訳(メタデータ) (2020-08-19T06:02:46Z) - Feature Pyramid Transformer [121.50066435635118]
我々は、FPT(Feature Pyramid Transformer)と呼ばれる、空間とスケールの双方で完全にアクティブな特徴相互作用を提案する。
FPTは任意の特徴ピラミッドを同じ大きさの他の特徴ピラミッドに変換するが、よりリッチなコンテキストを持つ。
我々は、インスタンスレベル(オブジェクト検出とインスタンスセグメンテーション)とピクセルレベルのセグメンテーションタスクの両方で広範な実験を行う。
論文 参考訳(メタデータ) (2020-07-18T15:16:32Z) - Adaptive feature recombination and recalibration for semantic
segmentation with Fully Convolutional Networks [57.64866581615309]
完全畳み込みネットワークを用いたセマンティックセグメンテーションに適応した特徴の組換えと空間適応型再分類ブロックを提案する。
その結果、再結合と再校正は競争ベースラインの結果を改善し、3つの異なる問題にまたがって一般化することを示した。
論文 参考訳(メタデータ) (2020-06-19T15:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。