論文の概要: CPKD: Clinical Prior Knowledge-Constrained Diffusion Models for Surgical Phase Recognition in Endoscopic Submucosal Dissection
- arxiv url: http://arxiv.org/abs/2507.03295v1
- Date: Fri, 04 Jul 2025 04:54:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:34.663268
- Title: CPKD: Clinical Prior Knowledge-Constrained Diffusion Models for Surgical Phase Recognition in Endoscopic Submucosal Dissection
- Title(参考訳): CPKD : 内視鏡下粘膜下郭清術における術前知識制約拡散モデルの検討
- Authors: Xiangning Zhang, Jinnan Chen, Qingwei Zhang, Yaqi Wang, Chengfeng Zhou, Xiaobo Li, Dahong Qian,
- Abstract要約: 本稿では,拡散原理を認知することによって位相認識を再現する新しい生成フレームワークであるCPKDについて紹介する。
提案するCPKDは,最先端手法よりも優れた,あるいは同等の性能を実現する。
- 参考スコア(独自算出の注目度): 6.812360406181253
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Gastrointestinal malignancies constitute a leading cause of cancer-related mortality worldwide, with advanced-stage prognosis remaining particularly dismal. Originating as a groundbreaking technique for early gastric cancer treatment, Endoscopic Submucosal Dissection has evolved into a versatile intervention for diverse gastrointestinal lesions. While computer-assisted systems significantly enhance procedural precision and safety in ESD, their clinical adoption faces a critical bottleneck: reliable surgical phase recognition within complex endoscopic workflows. Current state-of-the-art approaches predominantly rely on multi-stage refinement architectures that iteratively optimize temporal predictions. In this paper, we present Clinical Prior Knowledge-Constrained Diffusion (CPKD), a novel generative framework that reimagines phase recognition through denoising diffusion principles while preserving the core iterative refinement philosophy. This architecture progressively reconstructs phase sequences starting from random noise and conditioned on visual-temporal features. To better capture three domain-specific characteristics, including positional priors, boundary ambiguity, and relation dependency, we design a conditional masking strategy. Furthermore, we incorporate clinical prior knowledge into the model training to improve its ability to correct phase logical errors. Comprehensive evaluations on ESD820, Cholec80, and external multi-center demonstrate that our proposed CPKD achieves superior or comparable performance to state-of-the-art approaches, validating the effectiveness of diffusion-based generative paradigms for surgical phase recognition.
- Abstract(参考訳): 消化管悪性腫瘍は世界中のがん関連死亡の主な原因であり、進行期予後は特に軽度である。
早期胃癌治療の画期的手法として考案された内視鏡下粘膜郭清術は,多彩な消化管病変に対する多彩な介入へと発展してきた。
コンピュータ支援システムは、ESDの手続き精度と安全性を著しく向上させるが、その臨床応用は、複雑な内視鏡的ワークフローにおける信頼性の高い外科的位相認識という重要なボトルネックに直面している。
現在の最先端のアプローチは、時間的予測を反復的に最適化する多段階改良アーキテクチャに大きく依存している。
本稿では,拡散原理を認知することで相認識を再現し,コアイテレーティブ・リファインメント・哲学を保ちつつ,新たな生成フレームワークであるCPKDについて述べる。
このアーキテクチャは、ランダムノイズから始まるフェーズシーケンスを段階的に再構築し、視覚的時間的特徴に基づいて調整する。
位置前処理,境界あいまいさ,関係依存性など,ドメイン固有の3つの特性をよりよく把握するために,条件付きマスキング戦略を設計する。
さらに, 臨床先行知識をモデルトレーニングに組み込んで, 位相論理的誤りを補正する能力を向上させる。
ESD820, Cholec80, および外部マルチセンターの総合的な評価により, 提案したCPKDは, 最先端のアプローチよりも優れた, あるいは同等な性能を示し, 拡散型生成パラダイムの有効性を検証した。
関連論文リスト
- SPRMamba: Surgical Phase Recognition for Endoscopic Submucosal Dissection with Mamba [6.531066045206769]
リアルタイムの外科的位相認識のための新しいフレームワークであるSPRMambaを提案する。
MambaアーキテクチャとScaled Residual TranMambaブロックを統合して、時間的モデリングと局所的な詳細抽出を相乗化する。
最先端のパフォーマンス(ESD385では87.64%、以前の方法では1.0%)を達成し、外科手術全体にわたって堅牢な一般化性を示す。
論文 参考訳(メタデータ) (2024-09-18T16:26:56Z) - CIResDiff: A Clinically-Informed Residual Diffusion Model for Predicting Idiopathic Pulmonary Fibrosis Progression [38.14873567230233]
特発性肺線維症(IPF)は患者の死亡率に大きく相関する。
現在の臨床基準では1年間隔で2回のCT検査を必要とする疾患の進行を規定している。
そこで我々は, 患者のCT画像からIPFの進行を正確に予測する新しい拡散モデルを開発した。
論文 参考訳(メタデータ) (2024-08-01T22:01:42Z) - Safe Deep RL for Intraoperative Planning of Pedicle Screw Placement [61.28459114068828]
安全な深部強化学習(DRL)に基づく訓練経路計画にリアルタイムな観察を活用するロボット脊椎手術の術中計画手法を提案する。
本手法は,ゴールドスタンダード (GS) 掘削計画に関して,90%の骨貫通を達成できた。
論文 参考訳(メタデータ) (2023-05-09T11:42:53Z) - Explaining Clinical Decision Support Systems in Medical Imaging using
Cycle-Consistent Activation Maximization [112.2628296775395]
ディープニューラルネットワークを用いた臨床意思決定支援は、着実に関心が高まりつつあるトピックとなっている。
臨床医は、その根底にある意思決定プロセスが不透明で理解しにくいため、この技術の採用をためらうことが多い。
そこで我々は,より小さなデータセットであっても,分類器決定の高品質な可視化を生成するCycleGANアクティベーションに基づく,新たな意思決定手法を提案する。
論文 参考訳(メタデータ) (2020-10-09T14:39:27Z) - Retinopathy of Prematurity Stage Diagnosis Using Object Segmentation and
Convolutional Neural Networks [68.96150598294072]
未熟児網膜症(英: Retinopathy of Prematurity、ROP)は、主に体重の低い未熟児に影響を及ぼす眼疾患である。
網膜の血管の増殖を招き、視力喪失を招き、最終的には網膜剥離を招き、失明を引き起こす。
近年,ディープラーニングを用いて診断を自動化する試みが盛んに行われている。
本稿では,従来のモデルの成功を基盤として,オブジェクトセグメンテーションと畳み込みニューラルネットワーク(CNN)を組み合わせた新しいアーキテクチャを開発する。
提案システムでは,まず対象分割モデルを訓練し,画素レベルでの区切り線を識別し,その結果のマスクを追加の"カラー"チャネルとして付加する。
論文 参考訳(メタデータ) (2020-04-03T14:07:41Z) - TeCNO: Surgical Phase Recognition with Multi-Stage Temporal
Convolutional Networks [43.95869213955351]
外科的位相認識のための階層的予測補正を行う多段階時間畳み込みネットワーク(MS-TCN)を提案する。
本手法は腹腔鏡下胆嚢摘出術ビデオの2つのデータセットに対して,追加の外科的ツール情報を用いずに徹底的に評価した。
論文 参考訳(メタデータ) (2020-03-24T10:12:30Z) - Detecting Pancreatic Ductal Adenocarcinoma in Multi-phase CT Scans via
Alignment Ensemble [77.5625174267105]
膵管腺癌(PDAC)は最も致命的ながんの1つである。
複数のフェーズは単一のフェーズよりも多くの情報を提供するが、それらは整列せず、テクスチャにおいて不均一である。
PDAC検出性能を高めるために,これらすべてのアライメントのアンサンブルを提案する。
論文 参考訳(メタデータ) (2020-03-18T19:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。