論文の概要: BARNet: Bilinear Attention Network with Adaptive Receptive Fields for
Surgical Instrument Segmentation
- arxiv url: http://arxiv.org/abs/2001.07093v4
- Date: Fri, 22 May 2020 03:12:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-08 05:23:55.347151
- Title: BARNet: Bilinear Attention Network with Adaptive Receptive Fields for
Surgical Instrument Segmentation
- Title(参考訳): barnet: 手術器具のセグメンテーションのための適応受容場を有するバイリニアアテンションネットワーク
- Authors: Zhen-Liang Ni, Gui-Bin Bian, Guan-An Wang, Xiao-Hu Zhou, Zeng-Guang
Hou, Xiao-Liang Xie, Zhen Li and Yu-Han Wang
- Abstract要約: 本稿では,この2つの課題を解決するために,適応的受容場を有するバイリニアアテンションネットワークを提案する。
提案されたネットワークは、Cata7上で97.47%の平均IOUを達成し、2017年のEndoVisで10.10%のIOUが2位にランクインした。
- 参考スコア(独自算出の注目度): 26.44585036105453
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Surgical instrument segmentation is extremely important for computer-assisted
surgery. Different from common object segmentation, it is more challenging due
to the large illumination and scale variation caused by the special surgical
scenes. In this paper, we propose a novel bilinear attention network with
adaptive receptive field to solve these two challenges. For the illumination
variation, the bilinear attention module can capture second-order statistics to
encode global contexts and semantic dependencies between local pixels. With
them, semantic features in challenging areas can be inferred from their
neighbors and the distinction of various semantics can be boosted. For the
scale variation, our adaptive receptive field module aggregates multi-scale
features and automatically fuses them with different weights. Specifically, it
encodes the semantic relationship between channels to emphasize feature maps
with appropriate scales, changing the receptive field of subsequent
convolutions. The proposed network achieves the best performance 97.47% mean
IOU on Cata7 and comes first place on EndoVis 2017 by 10.10% IOU overtaking
second-ranking method.
- Abstract(参考訳): 手術器具のセグメンテーションはコンピュータ支援手術において極めて重要である。
一般的な物体のセグメンテーションとは異なり、特殊な手術シーンによる大きな照明とスケールの変化により、より困難である。
本稿では,これら2つの課題を解決するために,適応受容場を有する新しい双方向注意ネットワークを提案する。
照度の変化に対して、双線形アテンションモジュールは、グローバルコンテキストと局所ピクセル間のセマンティック依存関係をエンコードする2階統計をキャプチャすることができる。
それらにより、挑戦領域のセマンティックな特徴が隣人から推測され、様々なセマンティクスの区別が促進される。
適応的受容場加群は, マルチスケールの特徴を集約し, 異なる重みで自動的に融合する。
具体的には、チャネル間の意味関係をエンコードし、適切なスケールで特徴マップを強調し、後の畳み込みの受容野を変更する。
提案されたネットワークは、Cata7上で97.47%の平均IOUを達成し、2017年のEndoVisで10.10%のIOUが2位にランクインした。
関連論文リスト
- MSA$^2$Net: Multi-scale Adaptive Attention-guided Network for Medical Image Segmentation [8.404273502720136]
MSA$2$Netは、スキップ接続を適切に設計した新しいディープセグメンテーションフレームワークである。
本稿では,空間的特徴を選択的に強調するために,MASAG(Multi-Scale Adaptive Space Attention Gate)を提案する。
MSA$2$Netは、最先端のSOTA(State-of-the-art)よりも優れています。
論文 参考訳(メタデータ) (2024-07-31T14:41:10Z) - Adaptive Feature Fusion Neural Network for Glaucoma Segmentation on Unseen Fundus Images [13.03504366061946]
本研究では,未確認領域における緑内障セグメンテーションのための適応的特徴融合ニューラルネットワーク (AFNN) を提案する。
ドメインアダプタは、事前訓練されたモデルが、他の画像ドメインから医療基礎画像ドメインへの迅速な適応を支援する。
提案手法は,4つの公共緑内障データセット上の既存のファンドスセグメンテーション法と比較して,競争力のある性能を実現する。
論文 参考訳(メタデータ) (2024-04-02T16:30:12Z) - Self-Supervised Correction Learning for Semi-Supervised Biomedical Image
Segmentation [84.58210297703714]
半教師付きバイオメディカルイメージセグメンテーションのための自己教師付き補正学習パラダイムを提案する。
共有エンコーダと2つの独立デコーダを含むデュアルタスクネットワークを設計する。
異なるタスクのための3つの医用画像分割データセットの実験により,本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2023-01-12T08:19:46Z) - UniDAformer: Unified Domain Adaptive Panoptic Segmentation Transformer
via Hierarchical Mask Calibration [49.16591283724376]
単一ネットワーク内でのドメイン適応型インスタンス分割とセマンティックセマンティックセマンティックセマンティクスを同時に実現可能な,シンプルで統一されたドメイン適応型パン光学セマンティクスセマンティクス変換器UniDAformerを設計する。
UniDAformerは階層型マスク(Hierarchical Mask, HMC)を導入し、オンザフライでのオンラインセルフトレーニングを通じて、領域、スーパーピクセル、注釈付きピクセルのレベルで不正確な予測を修正した。
1) 統合されたドメイン適応型パン光学適応を可能にする; 2) 誤った予測を緩和し、ドメイン適応型パン光学セグメンテーションを効果的に改善する; 3) より単純なトレーニングと推論パイプラインでエンドツーエンドのトレーニングを可能にする。
論文 参考訳(メタデータ) (2022-06-30T07:32:23Z) - AF$_2$: Adaptive Focus Framework for Aerial Imagery Segmentation [86.44683367028914]
航空画像のセグメンテーションにはいくつかの独特な課題があり、中でも最も重要なものは前景と背景のアンバランスにある。
本稿では,階層的なセグメンテーション手法を採用し,マルチスケール表現を適応的に活用するAdaptive Focus Framework (AF$)を提案する。
AF$は、広く使われている3つの航空ベンチマークの精度を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-18T10:14:45Z) - DONet: Dual Objective Networks for Skin Lesion Segmentation [77.9806410198298]
本稿では,皮膚病変のセグメンテーションを改善するために,Dual Objective Networks (DONet) という,シンプルで効果的なフレームワークを提案する。
我々のDONetは2つの対称デコーダを採用し、異なる目標に近づくための異なる予測を生成する。
皮膚内視鏡画像における多種多様な病変のスケールと形状の課題に対処するために,再帰的コンテキスト符号化モジュール(RCEM)を提案する。
論文 参考訳(メタデータ) (2020-08-19T06:02:46Z) - Phase Consistent Ecological Domain Adaptation [76.75730500201536]
意味的セグメンテーション(意味的セグメンテーション)の課題に焦点をあてる。そこでは、注釈付き合成データが多用されるが、実際のデータへのアノテートは困難である。
視覚心理学に触発された最初の基準は、2つの画像領域間の地図が位相保存であることである。
第2の基準は、照明剤や撮像センサーの特性に関わらず、その画像に現れる環境統計、またはシーン内の規則を活用することを目的としている。
論文 参考訳(メタデータ) (2020-04-10T06:58:03Z) - Gated Path Selection Network for Semantic Segmentation [72.44994579325822]
我々は,適応的な受容場を学習することを目的とした,GPSNetという新しいネットワークを開発した。
GPSNetにおいて、我々はまず2次元のマルチスケールネットワーク、SuperNetを設計する。
望ましいセマンティックコンテキストを動的に選択するために、ゲート予測モジュールがさらに導入される。
論文 参考訳(メタデータ) (2020-01-19T12:32:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。