論文の概要: ReCal-Net: Joint Region-Channel-Wise Calibrated Network for Semantic
Segmentation in Cataract Surgery Videos
- arxiv url: http://arxiv.org/abs/2109.12448v1
- Date: Sat, 25 Sep 2021 22:16:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-28 15:41:16.652364
- Title: ReCal-Net: Joint Region-Channel-Wise Calibrated Network for Semantic
Segmentation in Cataract Surgery Videos
- Title(参考訳): recal-net : 白内障手術ビデオにおける意味セグメンテーションのための地域別調整ネットワーク
- Authors: Negin Ghamsarian, Mario Taschwer, Doris Putzgruber-Adamitsch,
Stephanie Sarny, Yosuf El-Shabrawi, and Klaus Schoeffmann
- Abstract要約: textitReCalモジュールと呼ばれる新しい畳み込みモジュールを提案する。このモジュールは,地域内および地域間距離とチャネル間距離を用いて特徴マップをキャリブレーションすることができる。
また,ReCal-Netと呼ばれるモジュールをベースとした新しいネットワークアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 6.364541434977173
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Semantic segmentation in surgical videos is a prerequisite for a broad range
of applications towards improving surgical outcomes and surgical video
analysis. However, semantic segmentation in surgical videos involves many
challenges. In particular, in cataract surgery, various features of the
relevant objects such as blunt edges, color and context variation, reflection,
transparency, and motion blur pose a challenge for semantic segmentation. In
this paper, we propose a novel convolutional module termed as \textit{ReCal}
module, which can calibrate the feature maps by employing region
intra-and-inter-dependencies and channel-region cross-dependencies. This
calibration strategy can effectively enhance semantic representation by
correlating different representations of the same semantic label, considering a
multi-angle local view centering around each pixel. Thus the proposed module
can deal with distant visual characteristics of unique objects as well as
cross-similarities in the visual characteristics of different objects.
Moreover, we propose a novel network architecture based on the proposed module
termed as ReCal-Net. Experimental results confirm the superiority of ReCal-Net
compared to rival state-of-the-art approaches for all relevant objects in
cataract surgery. Moreover, ablation studies reveal the effectiveness of the
ReCal module in boosting semantic segmentation accuracy.
- Abstract(参考訳): 手術ビデオにおけるセマンティックセグメンテーションは,手術成績の改善と手術ビデオ解析への幅広い応用の前提条件である。
しかし,手術ビデオのセグメンテーションには多くの課題がある。
特に白内障手術では、鈍的エッジ、色とコンテキストの変化、反射、透明性、動きのぼやきといった関連物体の様々な特徴が意味的セグメンテーションの課題となる。
本稿では,地域内および地域間依存性とチャネル間相互依存性を用いて特徴マップをキャリブレーションする,‘textit{ReCal}モジュール’と呼ばれる新しい畳み込みモジュールを提案する。
このキャリブレーション戦略は、各画素を中心にした多角的局所ビューを考慮して、同じセマンティックラベルの異なる表現を関連付けることで、セマンティック表現を効果的に強化することができる。
そこで,提案モジュールは,異なる物体の視覚的特徴と,異なる物体の視覚的特徴の相似性に対処することができる。
さらに,ReCal-Netと呼ばれるモジュールをベースとした新しいネットワークアーキテクチャを提案する。
実験の結果,白内障手術におけるすべての関連対象に対して,ReCal-Netが競合する最先端アプローチよりも優れていることが示された。
さらに, アブレーション研究により, recalモジュールのセグメンテーション精度の向上効果が示された。
関連論文リスト
- Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Self-Supervised Correction Learning for Semi-Supervised Biomedical Image
Segmentation [84.58210297703714]
半教師付きバイオメディカルイメージセグメンテーションのための自己教師付き補正学習パラダイムを提案する。
共有エンコーダと2つの独立デコーダを含むデュアルタスクネットワークを設計する。
異なるタスクのための3つの医用画像分割データセットの実験により,本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2023-01-12T08:19:46Z) - DeepPyramid: Enabling Pyramid View and Deformable Pyramid Reception for
Semantic Segmentation in Cataract Surgery Videos [9.00510634152686]
本稿では,DeepPyramidと呼ばれるセマンティックセグメンテーションネットワークを提案する。
これらのモジュールはセマンティックセグメンテーション性能を効果的に向上させることができることを示す。
我々は,本手法が最先端のレベルで動作し,多くの既存手法よりも大きなマージンを持つことを示す。
論文 参考訳(メタデータ) (2022-07-04T14:41:45Z) - The Emergence of Objectness: Learning Zero-Shot Segmentation from Videos [59.12750806239545]
動画は移動成分によって同じシーンを異なる視点で見ることができ、適切な領域分割と領域フローは相互のビュー合成を可能にする。
モデルでは,1枚の画像に対して特徴に基づく領域分割を出力する出現経路と,1枚の画像に対して動作特徴を出力する動き経路の2つの経路から開始する。
セグメントフローに基づく視線合成誤差を最小限に抑えるためにモデルを訓練することにより、我々の外観経路と運動経路は、それぞれ低レベルのエッジや光フローから構築することなく、領域のセグメンテーションとフロー推定を自動的に学習する。
論文 参考訳(メタデータ) (2021-11-11T18:59:11Z) - DeepPyram: Enabling Pyramid View and Deformable Pyramid Reception for
Semantic Segmentation in Cataract Surgery Videos [7.903979532478604]
本稿では,DeepPyramと呼ばれるセマンティックセグメンテーションネットワークを提案する。
白内障手術ビデオにおける関連物体のセグメント化において,様々な問題で優れた性能を得ることができる。
提案手法は,4つの白内障手術データセットを用いて,異なる文脈特徴を持つ対象に対して評価する。
論文 参考訳(メタデータ) (2021-09-11T19:31:52Z) - Relevance Detection in Cataract Surgery Videos by Spatio-Temporal Action
Localization [7.235239641693831]
白内障手術では、顕微鏡の助けを借りて手術を行います。
顕微鏡は最大2人程度でリアルタイム手術を観察できるため、記録されたビデオを用いて手術訓練の大部分を行う。
ビデオコンテンツでトレーニング手順を最適化するには、外科医は自動関連性検出アプローチが必要です。
本稿では,白内障映像における関連フェーズセグメントの検出と分類を行うための3モジュールフレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-29T12:01:08Z) - Few-shot Medical Image Segmentation using a Global Correlation Network
with Discriminative Embedding [60.89561661441736]
医療画像分割のための新しい手法を提案する。
深層畳み込みネットワークを用いた数ショット画像セグメンタを構築します。
深層埋め込みの識別性を高め,同一クラスの特徴領域のクラスタリングを促進する。
論文 参考訳(メタデータ) (2020-12-10T04:01:07Z) - DONet: Dual Objective Networks for Skin Lesion Segmentation [77.9806410198298]
本稿では,皮膚病変のセグメンテーションを改善するために,Dual Objective Networks (DONet) という,シンプルで効果的なフレームワークを提案する。
我々のDONetは2つの対称デコーダを採用し、異なる目標に近づくための異なる予測を生成する。
皮膚内視鏡画像における多種多様な病変のスケールと形状の課題に対処するために,再帰的コンテキスト符号化モジュール(RCEM)を提案する。
論文 参考訳(メタデータ) (2020-08-19T06:02:46Z) - Adaptive feature recombination and recalibration for semantic
segmentation with Fully Convolutional Networks [57.64866581615309]
完全畳み込みネットワークを用いたセマンティックセグメンテーションに適応した特徴の組換えと空間適応型再分類ブロックを提案する。
その結果、再結合と再校正は競争ベースラインの結果を改善し、3つの異なる問題にまたがって一般化することを示した。
論文 参考訳(メタデータ) (2020-06-19T15:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。