論文の概要: Rethinking Surgical Smoke: A Smoke-Type-Aware Laparoscopic Video Desmoking Method and Dataset
- arxiv url: http://arxiv.org/abs/2512.02780v1
- Date: Tue, 02 Dec 2025 13:55:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-03 21:04:45.901018
- Title: Rethinking Surgical Smoke: A Smoke-Type-Aware Laparoscopic Video Desmoking Method and Dataset
- Title(参考訳): 手術用スモークの再考:スモーク型腹腔鏡下ビデオデスモーキング法とデータセット
- Authors: Qifan Liang, Junlin Li, Zhen Han, Xihao Wang, Zhongyuan Wang, Bin Mei,
- Abstract要約: STANet(Smoke-type-Aware Laparoscopic Video Desmoking Network)
拡散スモークとアンビエントスモークの2種類を紹介する。
また,喫煙型アノテーションを用いた最初の大規模合成喫煙データセットを構築した。
- 参考スコア(独自算出の注目度): 21.493577935588732
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Electrocautery or lasers will inevitably generate surgical smoke, which hinders the visual guidance of laparoscopic videos for surgical procedures. The surgical smoke can be classified into different types based on its motion patterns, leading to distinctive spatio-temporal characteristics across smoky laparoscopic videos. However, existing desmoking methods fail to account for such smoke-type-specific distinctions. Therefore, we propose the first Smoke-Type-Aware Laparoscopic Video Desmoking Network (STANet) by introducing two smoke types: Diffusion Smoke and Ambient Smoke. Specifically, a smoke mask segmentation sub-network is designed to jointly conduct smoke mask and smoke type predictions based on the attention-weighted mask aggregation, while a smokeless video reconstruction sub-network is proposed to perform specially desmoking on smoky features guided by two types of smoke mask. To address the entanglement challenges of two smoke types, we further embed a coarse-to-fine disentanglement module into the mask segmentation sub-network, which yields more accurate disentangled masks through the smoke-type-aware cross attention between non-entangled and entangled regions. In addition, we also construct the first large-scale synthetic video desmoking dataset with smoke type annotations. Extensive experiments demonstrate that our method not only outperforms state-of-the-art approaches in quality evaluations, but also exhibits superior generalization across multiple downstream surgical tasks.
- Abstract(参考訳): エレクトロカテリーやレーザーは必然的に外科的煙を発生させ、外科手術のための腹腔鏡ビデオの視覚的誘導を妨げる。
手術煙は運動パターンに基づいて異なるタイプに分類することができ、スモーキーな腹腔鏡ビデオに特徴的な時空間特性をもたらす。
しかし、既存の禁煙法はそのような煙種特有の区別を考慮しない。
そこで,本研究では,拡散煙とアンビエント煙の2種類のスモークタイプを導入することで,最初のスモーク型腹腔鏡ビデオ喫煙ネットワーク(STANet)を提案する。
具体的には,スモークマスクのセグメンテーション・サブネットワークは,スモークマスクとアグリゲーションに基づくスモークタイプの予測を共同で行うように設計され,スモークレスビデオ再構成サブネットワークは2種類のスモークマスクでガイドされるスモークな特徴を特別にデモークする。
2種類の煙の絡み合い問題に対処するため,マスクセグメント化サブネットワークに粗大で微細な絡み合いモジュールを組み込み,非絡み合い領域と絡み合い領域間の煙型認識交差注意によりより高精度な絡み合いマスクを得る。
また,スモーク型アノテーションを用いた大規模な合成ビデオデ喫煙データセットの構築も行った。
大規模な実験により,本手法は品質評価において最先端のアプローチよりも優れるだけでなく,下流の複数の外科的タスクにおいて優れた一般化を示すことが示された。
関連論文リスト
- MFGDiffusion: Mask-Guided Smoke Synthesis for Enhanced Forest Fire Detection [6.307649189539342]
スモークは山火事の目に見える最初の指標である。
現在の塗装モデルは、高品質な煙の表現を生成するのに限界がある。
森林火災煙画像を生成するための総合的な枠組みを提案する。
論文 参考訳(メタデータ) (2025-07-15T12:25:35Z) - LSD3K: A Benchmark for Smoke Removal from Laparoscopic Surgery Images [0.7138611948315257]
腹腔鏡下手術で手術器具が生み出す煙は視野を曖昧にし、外科医が正確に安全に手術を行う能力を損なう。
近年、腹腔鏡画像の喫煙が研究者の注目を集めているが、このタスクの開発を妨害する主要なボトルネックは、公開可能な高品質なベンチマークデータセットの欠如である。
我々は, 3000対の合成非均一煙像からなる, LSD3Kと呼ばれる腹腔鏡下手術画像デスモーキングのための新しい高品質データセットを構築した。
論文 参考訳(メタデータ) (2024-07-18T03:42:16Z) - Attention-Aware Laparoscopic Image Desmoking Network with Lightness Embedding and Hybrid Guided Embedding [9.909043664967063]
煙の分布を推定し,鮮明で無煙な手術シーンを再構築するために,2段階のネットワークを提案する。
提案手法は、最先端の手法よりも2.79%高いピーク・シグナル・トゥ・ノイズ比を有する。
論文 参考訳(メタデータ) (2024-04-11T08:36:36Z) - Self-Supervised Video Desmoking for Laparoscopic Surgery [48.83900673665993]
自己監督型手術ビデオデモーキング(SelfSVD)について紹介する。
高エネルギー装置の起動前に捕捉したフレームは一般に明確である(プレスモークフレーム、PSフレーム)。
さらに、PSフレームからモデルに貴重な情報を供給し、マスキング戦略と正規化項を提示し、自明な解決策を避ける。
論文 参考訳(メタデータ) (2024-03-17T12:38:58Z) - Benchmarking Joint Face Spoofing and Forgery Detection with Visual and
Physiological Cues [81.15465149555864]
視覚的外観と生理的rcuesを用いた第1回関節スプーフィングおよび検出ベンチマークを作成した。
r周期性判別を強化するために,顔の強信号マップと連続ウェーブレットを入力として変換した2分岐生理ネットワークを設計した。
論文 参考訳(メタデータ) (2022-08-10T15:41:48Z) - Shape-Aware Masking for Inpainting in Medical Imaging [49.61617087640379]
インペイントは、教師なしの医用画像モデル発見のためのディープラーニング技術として成功している。
本稿では, 先行する統計的形状の学習を目的とした, 塗装用形状認識マスクの生成手法を提案する。
市販の塗装モデルとスーパーピクセルオーバーセグメンテーションアルゴリズムに基づく教師なしマスキング手法を提案する。
論文 参考訳(メタデータ) (2022-07-12T18:35:17Z) - STCNet: Spatio-Temporal Cross Network for Industrial Smoke Detection [52.648906951532155]
本稿では,産業用煙排出ガスを識別する新しい時空間クロスネットワーク(STCNet)を提案する。
提案するSTCNetは, テクスチャの特徴を抽出する空間的特徴と, 煙の動き情報を捕捉する時間的経路を含む。
STCNetは、RISE産業煙検知データセットにおいて、最も優れた競合相手に対して6.2%の精度で明確な改善を実現していることを示す。
論文 参考訳(メタデータ) (2020-11-10T02:28:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。