論文の概要: Dynamic Robot-Assisted Surgery with Hierarchical Class-Incremental Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2508.01713v2
- Date: Sun, 10 Aug 2025 11:57:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 13:12:52.240632
- Title: Dynamic Robot-Assisted Surgery with Hierarchical Class-Incremental Semantic Segmentation
- Title(参考訳): 階層型クラスインクリメンタルセマンティックセマンティックセグメンテーションを用いた動的ロボット支援手術
- Authors: Julia Hindel, Ema Mekic, Enamundram Naga Karthik, Rohit Mohan, Daniele Cattaneo, Maria Kalweit, Abhinav Valada,
- Abstract要約: クラスインクリメンタルセマンティックセグメンテーション(CISS)は、モデルが以前のデータをトレーニングすることなく、新しいクラスに継続的に適応できるようにする。
評価ベンチマークとしてオンラインでホストされたSyn-Mediverse合成データセットに144以上のクラスを持つ改良されたラベルセットを導入する。
- 参考スコア(独自算出の注目度): 11.59416791598718
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robot-assisted surgeries rely on accurate and real-time scene understanding to safely guide surgical instruments. However, segmentation models trained on static datasets face key limitations when deployed in these dynamic and evolving surgical environments. Class-incremental semantic segmentation (CISS) allows models to continually adapt to new classes while avoiding catastrophic forgetting of prior knowledge, without training on previous data. In this work, we build upon the recently introduced Taxonomy-Oriented Poincar\'e-regularized Incremental Class Segmentation (TOPICS) approach and propose an enhanced variant, termed TOPICS+, specifically tailored for robust segmentation of surgical scenes. Concretely, we incorporate the Dice loss into the hierarchical loss formulation to handle strong class imbalances, introduce hierarchical pseudo-labeling, and design tailored label taxonomies for robotic surgery environments. We also propose six novel CISS benchmarks designed for robotic surgery environments including multiple incremental steps and several semantic categories to emulate realistic class-incremental settings in surgical environments. In addition, we introduce a refined set of labels with more than 144 classes on the Syn-Mediverse synthetic dataset, hosted online as an evaluation benchmark. We make the code and trained models publicly available at http://topics.cs.uni-freiburg.de.
- Abstract(参考訳): ロボットによる外科手術は、手術器具を安全にガイドするために、正確でリアルタイムなシーン理解に依存している。
しかし、静的データセットでトレーニングされたセグメンテーションモデルは、これらの動的で進化する手術環境にデプロイする際、重要な制限に直面している。
クラスインクリメンタルセマンティックセグメンテーション(CISS)により、モデルが新しいクラスに継続的に適応できると同時に、過去のデータをトレーニングすることなく、過去の知識の破滅的な忘れを回避できる。
本研究では,最近導入されたTaxonomy-Oriented Poincar\'e-regularized Incremental Class Segmentation (TOPICS)アプローチに基づいて,手術シーンの堅牢なセグメンテーションに適したTOPICS+と呼ばれる拡張型を提案する。
具体的には、Diceの損失を階層的損失定式化に組み込んで、強いクラス不均衡を処理し、階層的擬似ラベルを導入し、ロボット手術環境に適したラベル分類を設計する。
また,手術環境における現実的なクラスインクリメンタル設定をエミュレートするために,複数の段階の段階といくつかの意味カテゴリーを含む,ロボット手術環境向けに設計された6つの新しいCISSベンチマークを提案する。
さらに,Syn-Mediverse 合成データセットに144以上のクラスを持つラベルセットを導入し,評価ベンチマークとしてオンラインにホストした。
コードとトレーニングされたモデルをhttp://topics.cs.uni-freiburg.deで公開しています。
関連論文リスト
- Surgical Foundation Model Leveraging Compression and Entropy Maximization for Image-Guided Surgical Assistance [50.486523249499115]
低侵襲手術(MIS)におけるリアルタイム映像理解の重要性
手術ビデオからコンパクトで情報的表現を学習するための,新しい自己教師型フレームワークであるCompress-to-Explore (C2E)を提案する。
C2Eは、エントロピー最大化デコーダを使用して、臨床的に関連する詳細を保持しながら画像を圧縮し、ラベル付きデータなしでエンコーダのパフォーマンスを向上させる。
論文 参考訳(メタデータ) (2025-05-16T14:02:24Z) - AMNCutter: Affinity-Attention-Guided Multi-View Normalized Cutter for Unsupervised Surgical Instrument Segmentation [7.594796294925481]
我々は,Multi-View Normalized Cutter(m-NCutter)という新しいモジュールを特徴とするラベルフリーな教師なしモデルを提案する。
本モデルでは, パッチ親和性を利用したグラフカット損失関数を用いて, 疑似ラベルの不要化を図った。
我々は、複数のSISデータセットにわたる包括的な実験を行い、事前訓練されたモデルとして、アプローチの最先端(SOTA)パフォーマンス、堅牢性、および例外的なポテンシャルを検証する。
論文 参考訳(メタデータ) (2024-11-06T06:33:55Z) - Low-Rank Continual Pyramid Vision Transformer: Incrementally Segment Whole-Body Organs in CT with Light-Weighted Adaptation [10.746776960260297]
軽量低ランク適応 (LoRA) を用いた新しい連続体器官分割モデルを提案する。
まず、最初のタスクでピラミッドビジョントランスフォーマー(PVT)ベースセグメンテーションモデルをトレーニングし、その後、新しい学習タスク毎に凍結モデルに軽量でトレーニング可能なLoRAパラメータを継続的に追加する。
提案モデルでは, 破滅的忘れを伴わず, 低パラメータ増加率を維持しながら, 新しい臓器を連続的に分割する。
論文 参考訳(メタデータ) (2024-10-07T02:00:13Z) - ECLIPSE: Efficient Continual Learning in Panoptic Segmentation with Visual Prompt Tuning [54.68180752416519]
パノプティカルセグメンテーション(英: Panoptic segmentation)は、コンピュータビジョンの最先端タスクである。
ECLIPSE と呼ばれる Visual Prompt Tuning をベースとした,新規で効率的なパノプティカルセグメンテーション手法を提案する。
我々のアプローチは、基本モデルのパラメータを凍結し、小さなプロンプト埋め込みだけを微調整することであり、破滅的な忘れ物と塑性の両方に対処する。
論文 参考訳(メタデータ) (2024-03-29T11:31:12Z) - Continual Learning for Abdominal Multi-Organ and Tumor Segmentation [15.983529525062938]
本稿では,連続臓器と腫瘍のセグメンテーションに特化して設計されたイノベーティブなアーキテクチャを提案する。
提案する設計では,従来の出力層を軽量なクラス固有のヘッド群に置き換える。
これらのヘッドは、新しく導入され、以前に学習されたクラスの独立した予測を可能にし、古いクラスに対する新しいクラスの影響を効果的に最小化する。
論文 参考訳(メタデータ) (2023-06-01T17:59:57Z) - Dynamic Conceptional Contrastive Learning for Generalized Category
Discovery [76.82327473338734]
Generalized category discovery (GCD) は、部分的にラベル付けされたデータを自動でクラスタリングすることを目的としている。
ラベル付きデータには、ラベル付きデータの既知のカテゴリだけでなく、新しいカテゴリのインスタンスも含まれている。
GCDの効果的な方法の1つは、ラベルなしデータの識別表現を学習するために自己教師付き学習を適用することである。
本稿では,クラスタリングの精度を効果的に向上する動的概念コントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-30T14:04:39Z) - From Forks to Forceps: A New Framework for Instance Segmentation of
Surgical Instruments [6.677634562400846]
最小侵襲手術と関連する応用は、インスタンスレベルでの外科的ツール分類とセグメンテーションを要求する。
本研究は,バウンディングボックスとセグメンテーションマスクが正確な場合が多いが,分類ヘッドが手術器具の分類ラベルを誤分類していることを示す。
我々は、既存のインスタンスセグメンテーションモデルに分類モジュールを新しいステージとして追加する新しいニューラルネットワークフレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-26T21:26:42Z) - TraSeTR: Track-to-Segment Transformer with Contrastive Query for
Instance-level Instrument Segmentation in Robotic Surgery [60.439434751619736]
そこで我々は,TraSeTRを提案する。TraSeTR,TraSeTR,Trace-to-Segment Transformerは,手術器具のセグメンテーションを支援する。
TraSeTRは、機器の種類、位置、アイデンティティとインスタンスレベルの予測を共同で理由付けている。
提案手法の有効性を,3つの公開データセットに対して,最先端の計器型セグメンテーション結果を用いて実証した。
論文 参考訳(メタデータ) (2022-02-17T05:52:18Z) - Self-Supervised Class Incremental Learning [51.62542103481908]
既存のクラスインクリメンタルラーニング(CIL)手法は、データラベルに敏感な教師付き分類フレームワークに基づいている。
新しいクラスデータに基づいて更新する場合、それらは破滅的な忘れがちである。
本稿では,SSCILにおける自己指導型表現学習のパフォーマンスを初めて考察する。
論文 参考訳(メタデータ) (2021-11-18T06:58:19Z) - Co-Generation and Segmentation for Generalized Surgical Instrument
Segmentation on Unlabelled Data [49.419268399590045]
正確な機器追跡と拡張現実オーバーレイには、ロボット支援手術のための外科用機器セグメンテーションが必要です。
深層学習法では手術器具のセグメンテーションに最先端のパフォーマンスが示されたが,結果はラベル付きデータに依存する。
本稿では,ロボットによる手術を含むさまざまなデータセット上で,これらの手法の限定的な一般化性を実証する。
論文 参考訳(メタデータ) (2021-03-16T18:41:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。