論文の概要: SurgiATM: A Physics-Guided Plug-and-Play Model for Deep Learning-Based Smoke Removal in Laparoscopic Surgery
- arxiv url: http://arxiv.org/abs/2511.05059v1
- Date: Fri, 07 Nov 2025 08:04:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-10 21:00:44.710058
- Title: SurgiATM: A Physics-Guided Plug-and-Play Model for Deep Learning-Based Smoke Removal in Laparoscopic Surgery
- Title(参考訳): SurgiATM:腹腔鏡下手術における深層学習による煙除去のための物理誘導プラグアンドプレイモデル
- Authors: Mingyu Sheng, Jianan Fan, Dongnan Liu, Guoyan Zheng, Ron Kikinis, Weidong Cai,
- Abstract要約: 組織因果によって生じる煙は、内視鏡的フレームの視覚的品質を著しく低下させる。
外科的煙除去のための外科的大気モデル(SurgiATM)を提案する。
SurgiATMは物理に基づく大気モデルとデータ駆動ディープラーニングモデルを統計的に橋渡しする。
- 参考スコア(独自算出の注目度): 16.71481757853012
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: During laparoscopic surgery, smoke generated by tissue cauterization can significantly degrade the visual quality of endoscopic frames, increasing the risk of surgical errors and hindering both clinical decision-making and computer-assisted visual analysis. Consequently, removing surgical smoke is critical to ensuring patient safety and maintaining operative efficiency. In this study, we propose the Surgical Atmospheric Model (SurgiATM) for surgical smoke removal. SurgiATM statistically bridges a physics-based atmospheric model and data-driven deep learning models, combining the superior generalizability of the former with the high accuracy of the latter. Furthermore, SurgiATM is designed as a lightweight, plug-and-play module that can be seamlessly integrated into diverse surgical desmoking architectures to enhance their accuracy and stability, better meeting clinical requirements. It introduces only two hyperparameters and no additional trainable weights, preserving the original network architecture with minimal computational and modification overhead. We conduct extensive experiments on three public surgical datasets with ten desmoking methods, involving multiple network architectures and covering diverse procedures, including cholecystectomy, partial nephrectomy, and diaphragm dissection. The results demonstrate that incorporating SurgiATM commonly reduces the restoration errors of existing models and relatively enhances their generalizability, without adding any trainable layers or weights. This highlights the convenience, low cost, effectiveness, and generalizability of the proposed method. The code for SurgiATM is released at https://github.com/MingyuShengSMY/SurgiATM.
- Abstract(参考訳): 腹腔鏡下手術では, 組織コータライゼーションにより発生した喫煙は, 内視鏡的フレームの視覚的品質を著しく低下させ, 外科的誤りのリスクを増大させ, 臨床的意思決定とコンピュータによる視覚分析の両方を妨げる可能性がある。
したがって、患者の安全を確保し、手術効率を維持するためには、外科的煙を除去することが重要である。
本研究では,外科的煙除去のための外科的大気モデル(SurgiATM)を提案する。
SurgiATMは物理に基づく大気モデルとデータ駆動のディープラーニングモデルを統計的に橋渡しし、前者の優れた一般化性と後者の高精度を組み合わせている。
さらに、SurgiATMは軽量なプラグアンドプレイモジュールとして設計されており、様々な外科的禁煙アーキテクチャにシームレスに統合され、精度と安定性を高め、臨床要件を満たすことができる。
2つのハイパーパラメータのみを導入し、トレーニング可能なウェイトを追加せず、最小限の計算と修正のオーバーヘッドで元のネットワークアーキテクチャを保存する。
総胆管摘出術,部分腎摘出術,横隔膜剥離術など,複数のネットワークアーキテクチャを包含し,多彩な手術手順を網羅する10種類の脱喫煙法を用いて3つの公開外科的データセットについて広範な実験を行った。
以上の結果から,SurgiATMの導入は既存のモデルの復元誤差を低減し,トレーニング可能な層や重みを加えることなく,比較的一般化性を高めることが示唆された。
提案手法の利便性,低コスト,有効性,一般化性を強調した。
SurgiATMのコードはhttps://github.com/MingyuShengSMY/SurgiATMで公開されている。
関連論文リスト
- Adaptive transfer learning for surgical tool presence detection in laparoscopic videos through gradual freezing fine-tuning [1.1371756033920992]
最小侵襲手術は、高度な分析と補助を可能にする自動手術ツール検出の恩恵を受けることができる。
外科的設定における注釈付きデータの可用性の制限は、堅牢なディープラーニングモデルをトレーニングする上での課題となる。
本稿では,線形探索段階と漸進凍結段階の2段階からなる適応微調整手法を提案する。
論文 参考訳(メタデータ) (2025-10-17T07:17:52Z) - SurgVisAgent: Multimodal Agentic Model for Versatile Surgical Visual Enhancement [8.337819078911405]
SurgVisAgentはマルチモーダル大言語モデル(MLLM)上に構築されたエンドツーエンドのインテリジェントな手術用視覚エージェントである。
内視鏡画像の歪みカテゴリと重度レベルを動的に識別し、様々な拡張タスクを実行できる。
我々は,SurgVisAgentが従来の単一タスクモデルを上回ることを示す大規模な実験を行い,実世界の外科的歪みをシミュレーションするベンチマークを構築した。
論文 参考訳(メタデータ) (2025-07-03T03:00:26Z) - Toward Reliable AR-Guided Surgical Navigation: Interactive Deformation Modeling with Data-Driven Biomechanics and Prompts [21.952265898720825]
本稿では,計算効率を向上しつつ,FEMレベルの精度を維持するデータ駆動アルゴリズムを提案する。
変形モデリングプロセスに新たなヒューマン・イン・ザ・ループ機構を導入する。
提案アルゴリズムは, 平均目標登録誤差を3.42mmとし, ボリューム精度で最先端の手法を超越した。
論文 参考訳(メタデータ) (2025-06-08T14:19:54Z) - Benchmarking Laparoscopic Surgical Image Restoration and Beyond [54.28852320829451]
腹腔鏡下手術では、明瞭で高品質な視野が外科医の正確な判断に不可欠である。
持続的な視覚劣化、例えば、エネルギー装置によって発生する煙、熱勾配から光るレンズ、およびレンズ汚染は患者の安全に危険をもたらす。
本稿では,SurgCleanと呼ばれる腹腔鏡下環境を対象とするオープンソースの手術画像復元データセットについて紹介する。
論文 参考訳(メタデータ) (2025-05-25T14:17:56Z) - Surgical Foundation Model Leveraging Compression and Entropy Maximization for Image-Guided Surgical Assistance [50.486523249499115]
低侵襲手術(MIS)におけるリアルタイム映像理解の重要性
手術ビデオからコンパクトで情報的表現を学習するための,新しい自己教師型フレームワークであるCompress-to-Explore (C2E)を提案する。
C2Eは、エントロピー最大化デコーダを使用して、臨床的に関連する詳細を保持しながら画像を圧縮し、ラベル付きデータなしでエンコーダのパフォーマンスを向上させる。
論文 参考訳(メタデータ) (2025-05-16T14:02:24Z) - Improved Brain Tumor Detection in MRI: Fuzzy Sigmoid Convolution in Deep Learning [5.350541719319564]
ファジィシグモイド・コンボリューション(FSC)は、最上位モジュールと中間モジュールの2つの追加モジュールと共に導入された。
新たな畳み込み演算子がこのアプローチの中心であり、入力データの整合性を保ちながら受容場を効果的に拡張する。
この研究は、医用イメージング応用のための軽量で高性能なディープラーニングモデルを提供する。
論文 参考訳(メタデータ) (2025-05-08T13:02:44Z) - Efficient Deformable Tissue Reconstruction via Orthogonal Neural Plane [58.871015937204255]
変形性組織を再建するための高速直交平面(Fast Orthogonal Plane)を導入する。
我々は外科手術を4Dボリュームとして概念化し、それらをニューラルネットワークからなる静的および動的フィールドに分解する。
この分解により4次元空間が増加し、メモリ使用量が減少し、最適化が高速化される。
論文 参考訳(メタデータ) (2023-12-23T13:27:50Z) - Neural LerPlane Representations for Fast 4D Reconstruction of Deformable
Tissues [52.886545681833596]
LerPlaneは単一視点環境下での手術シーンの高速かつ正確な再構築手法である。
LerPlaneは外科手術を4Dボリュームとして扱い、静的および動的フィールドの明示的な2D平面に分解する。
LerPlaneは静的フィールドを共有し、動的組織モデリングのワークロードを大幅に削減する。
論文 参考訳(メタデータ) (2023-05-31T14:38:35Z) - Safe Deep RL for Intraoperative Planning of Pedicle Screw Placement [61.28459114068828]
安全な深部強化学習(DRL)に基づく訓練経路計画にリアルタイムな観察を活用するロボット脊椎手術の術中計画手法を提案する。
本手法は,ゴールドスタンダード (GS) 掘削計画に関して,90%の骨貫通を達成できた。
論文 参考訳(メタデータ) (2023-05-09T11:42:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。