Fugu-MT 論文翻訳(概要): Benchmarking Pretrained Attention-based Models for Real-Time Recognition in Robot-Assisted Esophagectomy

論文の概要: Benchmarking Pretrained Attention-based Models for Real-Time Recognition in Robot-Assisted Esophagectomy

arxiv url: http://arxiv.org/abs/2412.03401v1
Date: Wed, 04 Dec 2024 15:32:37 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-05 21:42:00.716148
Title: Benchmarking Pretrained Attention-based Models for Real-Time Recognition in Robot-Assisted Esophagectomy
Title（参考訳）: ロボットによる食道摘出術における注意ベースモデルによるリアルタイム認識のベンチマーク
Authors: Ronald L. P. D. de Jong, Yasmina al Khalil, Tim J. M. Jaspers, Romy C. van Jaarsveld, Gino M. Kuiper, Yiping Li, Richard van Hillegersberg, Jelle P. Ruurda, Marcel Breeuwer, Fons van der Sommen,
Abstract要約: 食道癌は世界中で最も多いがんの1つである。近年,ロボットによる最小侵襲食道切除術が有望な代替手段として浮上している。コンピュータ支援解剖学の認識は、手術ナビゲーションを改善することを約束する。
参考スコア（独自算出の注目度）: 2.847280871973632
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Esophageal cancer is among the most common types of cancer worldwide. It is traditionally treated using open esophagectomy, but in recent years, robot-assisted minimally invasive esophagectomy (RAMIE) has emerged as a promising alternative. However, robot-assisted surgery can be challenging for novice surgeons, as they often suffer from a loss of spatial orientation. Computer-aided anatomy recognition holds promise for improving surgical navigation, but research in this area remains limited. In this study, we developed a comprehensive dataset for semantic segmentation in RAMIE, featuring the largest collection of vital anatomical structures and surgical instruments to date. Handling this diverse set of classes presents challenges, including class imbalance and the recognition of complex structures such as nerves. This study aims to understand the challenges and limitations of current state-of-the-art algorithms on this novel dataset and problem. Therefore, we benchmarked eight real-time deep learning models using two pretraining datasets. We assessed both traditional and attention-based networks, hypothesizing that attention-based networks better capture global patterns and address challenges such as occlusion caused by blood or other tissues. The benchmark includes our RAMIE dataset and the publicly available CholecSeg8k dataset, enabling a thorough assessment of surgical segmentation tasks. Our findings indicate that pretraining on ADE20k, a dataset for semantic segmentation, is more effective than pretraining on ImageNet. Furthermore, attention-based models outperform traditional convolutional neural networks, with SegNeXt and Mask2Former achieving higher Dice scores, and Mask2Former additionally excelling in average symmetric surface distance.
Abstract（参考訳）: 食道癌は世界中で最も多いがんの1つである。従来は開腹食道切除術が用いられてきたが,近年はロボット支援の最小侵襲食道切除術(RAMIE)が有望な代替手段として出現している。しかし、ロボットによる外科手術は、しばしば空間的向きの喪失に悩まされるため、初心者の外科医にとって困難である。コンピュータ支援解剖学は外科ナビゲーションの改善を約束するが、この分野の研究は限られている。本研究では,RAMIEにおける意味的セグメンテーションのための包括的データセットを開発し,これまでで最大の解剖学的構造と手術器具の収集を行った。この多様なクラスを扱うことは、クラス不均衡や神経のような複雑な構造の認識など、課題を提示する。本研究の目的は,この新たなデータセットと問題に対して,現在の最先端アルゴリズムの課題と限界を理解することである。そこで,2つの事前学習データセットを用いて8つのリアルタイムディープラーニングモデルをベンチマークした。我々は、従来のネットワークと注意に基づくネットワークの両方を評価し、注意に基づくネットワークは、よりグローバルなパターンを捉え、血液や他の組織によって引き起こされる閉塞のような課題に対処する、という仮説を立てた。ベンチマークにはRAMIEデータセットと一般公開されているCholecSeg8kデータセットが含まれており、外科的セグメンテーションタスクの徹底的な評価を可能にする。セマンティックセグメンテーションのデータセットであるADE20kの事前トレーニングは、ImageNetの事前トレーニングよりも効果的であることを示す。さらに、注意に基づくモデルは従来の畳み込みニューラルネットワークより優れており、SegNeXtとMask2Formerはより高いDiceスコアを達成し、Mask2Formerは平均対称表面距離でさらに優れている。

関連論文リスト

Rethinking Convergence in Deep Learning: The Predictive-Corrective Paradigm for Anatomy-Informed Brain MRI Segmentation [30.94379425064039]
本稿では,学習を根本的に加速させるために,モデルタスクを分離するフレームワークである予測補正(PC)パラダイムを紹介する。 PCambaNetは2つの相乗的モジュールから構成される。第一に、予測優先モジュール(PPM)は計算コストの低い粗い近似を生成する。次に、Corrective Residual Network (CRN)は、残差エラーをモデル化することを学び、ネットワークのフル容量をこれらの課題領域の精製に集中させる。
論文参考訳（メタデータ） (2025-10-17T08:51:33Z)
Challenges in Deep Learning-Based Small Organ Segmentation: A Benchmarking Perspective for Medical Research with Limited Datasets [1.2648105980808475]
本研究では,最先端のディープラーニングセグメンテーションモデルの体系的評価について検討する。その結果, モデル性能はデータ分割に非常に敏感であり, 統計的ノイズによる差は, 真のアルゴリズム上の優越性よりも小さいことがわかった。
論文参考訳（メタデータ） (2025-09-07T01:54:20Z)
Weakly supervised deep learning model with size constraint for prostate cancer detection in multiparametric MRI and generalization to unseen domains [0.90668179713299]
本モデルでは, 完全教師付きベースラインモデルにより, オンパー性能が向上することを示す。また、未確認データドメインでテストした場合、完全に教師付きモデルと弱い教師付きモデルの両方のパフォーマンス低下も観察する。
論文参考訳（メタデータ） (2024-11-04T12:24:33Z)
EP-SAM: Weakly Supervised Histopathology Segmentation via Enhanced Prompt with Segment Anything [3.760646312664378]
がんなどの疾患の病理診断は、従来、医師や病理医による形態学的特徴の評価に頼っていた。近年,診断支援ツールとしてコンピュータ支援診断(CAD)システムの進歩が注目されている。本稿では,クラスアクティベーションマップとSAMに基づく擬似ラベルを組み合わせ,弱教師付きセマンティックセマンティックセグメンテーション(WSSS)モデルを提案する。
論文参考訳（メタデータ） (2024-10-17T14:55:09Z)
Deep Grading based on Collective Artificial Intelligence for AD Diagnosis and Prognosis [0.0]
アルツハイマー病の診断と予後を自動化するための新しい枠組みを提案する。フレームワークは2つの段階から構成される。第1段階では,意味のある特徴を抽出するための深い階調モデルを提案する。第2段階では、ADシグネチャをよりよくキャプチャするために、グラフ畳み込みニューラルネットワークを使用します。
論文参考訳（メタデータ） (2022-11-28T09:59:08Z)
Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文参考訳（メタデータ） (2022-07-17T07:05:39Z)
Dissecting Self-Supervised Learning Methods for Surgical Computer Vision [51.370873913181605]
一般のコンピュータビジョンコミュニティでは,自己監視学習(SSL)手法が普及し始めている。医学や手術など、より複雑で影響力のある領域におけるSSLメソッドの有効性は、限定的かつ未調査のままである。外科的文脈理解,位相認識,ツール存在検出の2つの基本的なタスクに対して,これらの手法の性能をColec80データセット上で広範囲に解析する。
論文参考訳（メタデータ） (2022-07-01T14:17:11Z)
Longitudinal detection of new MS lesions using Deep Learning [0.0]
新たなMS病変の検出・分節作業に対処するディープラーニングベースのパイプラインについて述べる。まず,1つの時間点を用いたセグメンテーションタスクで訓練されたモデルからの移動学習を提案する。第2に、新しい病変を伴う現実的な縦断時間を生成するためのデータ合成戦略を提案する。
論文参考訳（メタデータ） (2022-06-16T16:09:04Z)
Medulloblastoma Tumor Classification using Deep Transfer Learning with Multi-Scale EfficientNets [63.62764375279861]
本稿では,エンド・ツー・エンドのMB腫瘍分類を提案し,様々な入力サイズとネットワーク次元の一致した移動学習を提案する。 161ケースのデータセットを用いて、より大規模な入力解像度を持つ事前学習されたEfficientNetが、大幅な性能改善をもたらすことを実証した。
論文参考訳（メタデータ） (2021-09-10T13:07:11Z)
An Uncertainty-Driven GCN Refinement Strategy for Organ Segmentation [53.425900196763756]
本研究では,不確実性解析とグラフ畳み込みネットワークに基づくセグメンテーション改善手法を提案する。半教師付きグラフ学習問題を定式化するために、特定の入力ボリュームにおける畳み込みネットワークの不確実性レベルを用いる。本手法は膵臓で1%,脾臓で2%向上し,最先端のCRF改善法よりも優れていた。
論文参考訳（メタデータ） (2020-12-06T18:55:07Z)
Instance-aware Self-supervised Learning for Nuclei Segmentation [47.07869311690419]
本稿では,核インスタンス分割タスクにおける畳み込みニューラルネットワーク(CNN)の能力を活用するための,新たな自己教師型学習フレームワークを提案する。提案するアプローチには、2つのサブタスクが含まれており、ニューラルネットワークは、核の大きさと量の事前知識を暗黙的に活用することができる。公開されているMoNuSegデータセットの実験結果から、提案した自己教師付き学習手法は、核インスタンスのセグメンテーション精度を著しく向上させることができることが示された。
論文参考訳（メタデータ） (2020-07-22T03:37:14Z)
Progressive Adversarial Semantic Segmentation [11.323677925193438]
深い畳み込みニューラルネットワークは、完全な監視が与えられた場合、非常によく機能する。画像解析タスクのための完全教師付きモデルの成功は、大量のラベル付きデータの入手に限られる。本稿では,新しい医用画像分割モデル,Progressive Adrial Semantic(PASS)を提案する。
論文参考訳（メタデータ） (2020-05-08T22:48:00Z)
Robust Medical Instrument Segmentation Challenge 2019 [56.148440125599905]
腹腔鏡装置の術中追跡は、しばしばコンピュータとロボットによる介入の必要条件である。本研究の課題は,30の手術症例から取得した10,040枚の注釈画像からなる外科的データセットに基づいていた。結果は、初期仮説、すなわち、アルゴリズムの性能がドメインギャップの増大とともに低下することを確認する。
論文参考訳（メタデータ） (2020-03-23T14:35:08Z)
VerSe: A Vertebrae Labelling and Segmentation Benchmark for Multi-detector CT Images [121.31355003451152]
大規模Vertebrae Challenge(VerSe)は、2019年と2020年に開催されたMICCAI(International Conference on Medical Image Computing and Computer Assisted Intervention)と共同で設立された。本評価の結果を報告するとともに,脊椎レベル,スキャンレベル,および異なる視野での性能変化について検討した。
論文参考訳（メタデータ） (2020-01-24T21:09:18Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。