論文の概要: RobustSurg: Tackling domain generalisation for out-of-distribution surgical scene segmentation
- arxiv url: http://arxiv.org/abs/2512.02188v1
- Date: Mon, 01 Dec 2025 20:31:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-03 21:04:45.597457
- Title: RobustSurg: Tackling domain generalisation for out-of-distribution surgical scene segmentation
- Title(参考訳): RobustSurg: アウト・オブ・ディストリビューション手術シーンセグメンテーションのためのタグリング領域の一般化
- Authors: Mansoor Ali, Maksim Richards, Gilberto Ochoa-Ruiz, Sharib Ali,
- Abstract要約: 分布外データとモダリティ変化による領域ギャップの一般化に関する最近の文献は、広く研究されているが、主に自然のシーンデータを対象としている。
本研究は,OODデータに対する汎用性を高めるために,自然シーンにおけるこれらの作品に触発されて,手術シーンにおけるスタイルや内容情報を活用することで,外観を最小化できるのではないか,という仮説を立てた。
- 参考スコア(独自算出の注目度): 7.9220056699521875
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While recent advances in deep learning for surgical scene segmentation have demonstrated promising results on single-centre and single-imaging modality data, these methods usually do not generalise to unseen distribution (i.e., from other centres) and unseen modalities. Current literature for tackling generalisation on out-of-distribution data and domain gaps due to modality changes has been widely researched but mostly for natural scene data. However, these methods cannot be directly applied to the surgical scenes due to limited visual cues and often extremely diverse scenarios compared to the natural scene data. Inspired by these works in natural scenes to push generalisability on OOD data, we hypothesise that exploiting the style and content information in the surgical scenes could minimise the appearances, making it less variable to sudden changes such as blood or imaging artefacts. This can be achieved by performing instance normalisation and feature covariance mapping techniques for robust and generalisable feature representations. Further, to eliminate the risk of removing salient feature representation associated with the objects of interest, we introduce a restitution module within the feature learning ResNet backbone that can enable the retention of useful task-relevant features. To tackle the lack of multiclass and multicentre data for surgical scene segmentation, we also provide a newly curated dataset that can be vital for addressing generalisability in this domain. Our proposed RobustSurg obtained nearly 23% improvement on the baseline DeepLabv3+ and from 10-32% improvement on the SOTA in terms of mean IoU score on an unseen centre HeiCholSeg dataset when trained on CholecSeg8K. Similarly, RobustSurg also obtained nearly 22% improvement over the baseline and nearly 11% improvement on a recent SOTA method for the target set of the EndoUDA polyp dataset.
- Abstract(参考訳): 近年の深層学習におけるシーンセグメンテーションの進歩は, 単一中心および単一像のモダリティデータに対して有望な結果を示しているが, これらの手法は通常, 見えない分布(すなわち, 他中心からの偏差)や見えないモダリティに一般化しない。
分布外データとモダリティ変化による領域ギャップの一般化に関する最近の文献は、広く研究されているが、主に自然のシーンデータを対象としている。
しかし,これらの手法は自然のシーンデータと比較して限られた視覚的手がかりや極めて多様なシナリオのために,手術シーンに直接適用することはできない。
本研究は,OODデータに一般性を持たせるために自然環境下でのこれらの作業に触発され,手術シーンにおけるスタイルや内容情報の利用によって外観が最小化され,血液や画像アーティファクトなどの急激な変化に対する変動が小さくなるのではないか,という仮説を立てる。
これは、堅牢で一般化可能な特徴表現のためのインスタンス正規化と特徴共分散マッピング技術を実行することで実現できる。
さらに,関心対象に関連付けられた有能な特徴表現を除去するリスクを取り除くため,有用なタスク関連特徴の保持を可能にする機能学習ResNetバックボーン内に再構成モジュールを導入する。
手術シーンセグメンテーションのためのマルチクラスデータとマルチセントデータの欠如に対処するため,この領域の一般性に対処するためには,新たにキュレートされたデータセットも提供する。
We proposed RobustSurg obtained almost 23% improve on the baseline DeepLabv3+ and from 10-32% improve on the SOTA in terms of the mean IoU score on a unseen center HeiCholSeg dataset when training on CholecSeg8K。
同様に、RobustSurgはベースラインよりも22%近く改善され、EndoUDApolypデータセットのターゲットセットに対する最近のSOTAメソッドでは11%近く改善された。
関連論文リスト
- Tackling domain generalization for out-of-distribution endoscopic imaging [1.6377635288143584]
我々は、画像のスタイル情報とコンテンツ情報の両方を利用して、堅牢で一般化可能な特徴表現を保存する。
提案手法は, ベースラインであるDeepLabv3+よりも13.7%向上し, 最新のSOTA(State-of-the-art)手法よりも8%改善した。
論文 参考訳(メタデータ) (2024-10-18T18:45:13Z) - Handling Geometric Domain Shifts in Semantic Segmentation of Surgical RGB and Hyperspectral Images [67.66644395272075]
本稿では,幾何学的アウト・オブ・ディストリビューションデータに直面する場合の,最先端のセマンティックセマンティックセマンティクスモデルの最初の解析を行う。
本稿では, 汎用性を高めるために, 有機移植(Organ Transplantation)と呼ばれる拡張技術を提案する。
我々の拡張技術は、RGBデータに対して最大67%、HSIデータに対して90%のSOAモデル性能を改善し、実際のOODテストデータに対して、分配内パフォーマンスのレベルでのパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-08-27T19:13:15Z) - Dual-Reference Source-Free Active Domain Adaptation for Nasopharyngeal
Carcinoma Tumor Segmentation across Multiple Hospitals [9.845637899896365]
鼻咽頭癌(Nasopharyngeal carcinoma, NPC)は頭頸部の悪性腫瘍である。
本稿では,Gross tumor Volume (GTV)セグメンテーションタスクの領域適応を容易にするために,新しい Sourece-Free Active Domain Adaptation (SFADA) フレームワークを提案する。
5つの病院から1057人のNPC患者からなる大規模臨床データセットを収集し,そのアプローチを検証した。
論文 参考訳(メタデータ) (2023-09-23T15:26:27Z) - Cross-Dataset Adaptation for Instrument Classification in Cataract
Surgery Videos [54.1843419649895]
特定のデータセットでこのタスクをうまく実行する最先端モデルでは、別のデータセットでテストすると、パフォーマンスが低下する。
本稿では,Barlow Adaptorと呼ばれる新しいエンドツーエンドのUnsupervised Domain Adaptation (UDA)手法を提案する。
さらに,BFAL(Barlow Feature Alignment Loss)と呼ばれる,異なるドメインにまたがる特徴を整列させる新たな損失を導入する。
論文 参考訳(メタデータ) (2023-07-31T18:14:18Z) - Learnable Weight Initialization for Volumetric Medical Image Segmentation [66.3030435676252]
本稿では,学習可能な重みに基づくハイブリッド医療画像セグメンテーション手法を提案する。
我々のアプローチはどんなハイブリッドモデルにも簡単に統合でき、外部のトレーニングデータを必要としない。
多臓器・肺がんセグメンテーションタスクの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-06-15T17:55:05Z) - Domain Generalization with Adversarial Intensity Attack for Medical
Image Segmentation [27.49427483473792]
実世界のシナリオでは、トレーニング中に露出していない新しいドメインや異なるドメインのデータに遭遇することが一般的である。
ドメイン一般化(Domain Generalization, DG)は、モデルがこれまで見つからなかったドメインからのデータを扱うことを可能にする、有望な方向である。
本稿では,敵対的トレーニングを活用して無限のスタイルでトレーニングデータを生成する,AdverIN(Adversarial Intensity Attack)と呼ばれる新しいDG手法を提案する。
論文 参考訳(メタデータ) (2023-04-05T19:40:51Z) - Semantic segmentation of surgical hyperspectral images under geometric
domain shifts [69.91792194237212]
本稿では、幾何学的アウト・オブ・ディストリビューション(OOD)データの存在下で、最先端のセマンティックセグメンテーションネットワークを初めて分析する。
有機移植(Organ transplantation)と呼ばれる専用の拡張技術により、一般化可能性にも対処する。
提案手法は,SOA DSCの最大67 % (RGB) と90% (HSI) を改善し,実際のOODテストデータ上での分配内性能と同等の性能を示す。
論文 参考訳(メタデータ) (2023-03-20T09:50:07Z) - Multi-scale Feature Alignment for Continual Learning of Unlabeled
Domains [3.9498537297431167]
生成的特徴駆動のイメージリプレイとデュアル目的判別器は、リプレイのための現実的な特徴を持つ画像の生成を可能にする。
本稿では,提案手法の構成要素について詳細なアブレーション実験を行い,非教師付きパッチベースセグメンテーションタスクに対する連続的UDA法の適用可能性を示す。
論文 参考訳(メタデータ) (2023-02-02T18:19:01Z) - AADG: Automatic Augmentation for Domain Generalization on Retinal Image
Segmentation [1.0452185327816181]
AADG(Automated Augmentation for Domain Generalization)と呼ばれるデータ操作に基づくドメイン一般化手法を提案する。
我々のAADGフレームワークは、新しいドメインを生成するデータ拡張ポリシーを効果的にサンプリングすることができる。
提案するAADGは,最先端の一般化性能を示し,既存手法より優れている。
論文 参考訳(メタデータ) (2022-07-27T02:26:01Z) - Dissecting Self-Supervised Learning Methods for Surgical Computer Vision [51.370873913181605]
一般のコンピュータビジョンコミュニティでは,自己監視学習(SSL)手法が普及し始めている。
医学や手術など、より複雑で影響力のある領域におけるSSLメソッドの有効性は、限定的かつ未調査のままである。
外科的文脈理解,位相認識,ツール存在検出の2つの基本的なタスクに対して,これらの手法の性能をColec80データセット上で広範囲に解析する。
論文 参考訳(メタデータ) (2022-07-01T14:17:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。