論文の概要: Seeing Through Smoke: Surgical Desmoking for Improved Visual Perception
- arxiv url: http://arxiv.org/abs/2603.25867v1
- Date: Thu, 26 Mar 2026 19:49:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 21:49:48.254768
- Title: Seeing Through Smoke: Surgical Desmoking for Improved Visual Perception
- Title(参考訳): スモークを通して見る:視力改善のための外科的禁煙
- Authors: Jingpei Lu, Fengyi Jiang, Xiaorui Zhang, Lingbo Jin, Omid Mohareri,
- Abstract要約: 侵襲的かつロボット支援的な手術は、内視鏡画像に大きく依存する。
本研究では,無煙画像と対応する喫煙マップを共同で予測する物理刺激型消煙頭を用いたトランスフォーマーを用いた手術用消煙モデルを提案する。
- 参考スコア(独自算出の注目度): 8.788053679150911
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Minimally invasive and robot-assisted surgery relies heavily on endoscopic imaging, yet surgical smoke produced by electrocautery and vessel-sealing instruments can severely degrade visual perception and hinder vision-based functionalities. We present a transformer-based surgical desmoking model with a physics-inspired desmoking head that jointly predicts smoke-free image and corresponding smoke map. To address the scarcity of paired smoky-to-smoke-free training data, we develop a synthetic data generation pipeline that blends artificial smoke patterns with real endoscopic images, yielding over 80,000 paired samples for supervised training. We further curate, to our knowledge, the largest paired surgical smoke dataset to date, comprising 5,817 image pairs captured with the da Vinci robotic surgical system, enabling benchmarking on high-resolution endoscopic images. Extensive experiments on both a public benchmark and our dataset demonstrate state-of-the-art performance in image reconstruction compared to existing dehazing and desmoking approaches. We also assess the impact of desmoking on downstream stereo depth estimation and instrument segmentation, highlighting both the potential benefits and current limitations of digital smoke removal methods.
- Abstract(参考訳): 最小限の侵襲とロボット支援の手術は、内視鏡画像に大きく依存するが、電気診断や血管シール装置によって生じる外科的煙は、視覚の知覚を著しく低下させ、視覚ベースの機能を妨げる。
本研究では,無煙画像と対応する喫煙マップを共同で予測する物理刺激型消煙頭を用いたトランスフォーマーを用いた手術用消煙モデルを提案する。
そこで我々は, 人工煙パターンと実際の内視鏡像を混合した合成データ生成パイプラインを開発し, 教師付きトレーニングのために8万枚以上のサンプルを合成した。
さらに我々は,ダ・ヴィンチのロボット手術システムで捉えた5,817枚の画像からなる,これまでで最大の手術用スモークデータセットを収集し,高解像度の内視鏡画像のベンチマークを可能にした。
パブリックベンチマークとデータセットの両方での大規模な実験により、既存のデハジングやデモーキングのアプローチと比較して、画像再構成における最先端のパフォーマンスが実証された。
また,ダウンストリームステレオ深度推定と計器セグメンテーションに対する脱煙の影響を評価し,デジタル煙除去法の潜在的な利点と現在の限界を強調した。
関連論文リスト
- Laparoscopic Image Desmoking Using the U-Net with New Loss Function and Integrated Differentiable Wiener Filter [5.747172898125006]
腹腔鏡下手術は、手術器具によって引き起こされた外科的煙の存在により、視力の低下に悩まされることが多い。
手術煙を除去するために,新しい損失関数と差別化可能なウィナーフィルタ (ULW) を用いた新しいU-Net深層学習法を提案する。
実験の結果,提案手法は視覚的明瞭度と距離に基づく評価の両面で優れていることがわかった。
論文 参考訳(メタデータ) (2025-05-27T18:07:06Z) - Ultrasound Lung Aeration Map via Physics-Aware Neural Operators [78.6077820217471]
肺超音波は、急性肺疾患や慢性肺疾患を診断するクリニックにおいて増加するモダリティである。
超音波による空気透過性の低下に起因する胸膜界面からの複雑な逆流によって複雑になる。
RFデータから肺エアレーションマップを直接再構成するAIモデルLUNAを提案する。
論文 参考訳(メタデータ) (2025-01-02T09:24:34Z) - LSD3K: A Benchmark for Smoke Removal from Laparoscopic Surgery Images [0.7138611948315257]
腹腔鏡下手術で手術器具が生み出す煙は視野を曖昧にし、外科医が正確に安全に手術を行う能力を損なう。
近年、腹腔鏡画像の喫煙が研究者の注目を集めているが、このタスクの開発を妨害する主要なボトルネックは、公開可能な高品質なベンチマークデータセットの欠如である。
我々は, 3000対の合成非均一煙像からなる, LSD3Kと呼ばれる腹腔鏡下手術画像デスモーキングのための新しい高品質データセットを構築した。
論文 参考訳(メタデータ) (2024-07-18T03:42:16Z) - Attention-Aware Laparoscopic Image Desmoking Network with Lightness Embedding and Hybrid Guided Embedding [9.909043664967063]
煙の分布を推定し,鮮明で無煙な手術シーンを再構築するために,2段階のネットワークを提案する。
提案手法は、最先端の手法よりも2.79%高いピーク・シグナル・トゥ・ノイズ比を有する。
論文 参考訳(メタデータ) (2024-04-11T08:36:36Z) - CathFlow: Self-Supervised Segmentation of Catheters in Interventional Ultrasound Using Optical Flow and Transformers [66.15847237150909]
縦型超音波画像におけるカテーテルのセグメンテーションのための自己教師型ディープラーニングアーキテクチャを提案する。
ネットワークアーキテクチャは、Attention in Attentionメカニズムで構築されたセグメンテーショントランスフォーマであるAiAReSeg上に構築されている。
我々は,シリコンオルタファントムから収集した合成データと画像からなる実験データセット上で,我々のモデルを検証した。
論文 参考訳(メタデータ) (2024-03-21T15:13:36Z) - Self-Supervised Video Desmoking for Laparoscopic Surgery [48.83900673665993]
自己監督型手術ビデオデモーキング(SelfSVD)について紹介する。
高エネルギー装置の起動前に捕捉したフレームは一般に明確である(プレスモークフレーム、PSフレーム)。
さらに、PSフレームからモデルに貴重な情報を供給し、マスキング戦略と正規化項を提示し、自明な解決策を避ける。
論文 参考訳(メタデータ) (2024-03-17T12:38:58Z) - AiAReSeg: Catheter Detection and Segmentation in Interventional
Ultrasound using Transformers [75.20925220246689]
血管内手術は、電離放射線を用いてカテーテルと血管を可視化するFluoroscopyの黄金標準を用いて行われる。
本研究では、最先端機械学習トランスフォーマアーキテクチャを応用して、軸干渉超音波画像シーケンス中のカテーテルを検出し、セグメント化する手法を提案する。
論文 参考訳(メタデータ) (2023-09-25T19:34:12Z) - Desmoking laparoscopy surgery images using an image-to-image translation
guided by an embedded dark channel [3.1706553206969916]
腹腔鏡下手術では、$CO$注入による煙と解離ツールにより、画像の視認性が著しく低下する可能性がある。
本稿では,煙効果を除去するための新しい計算手法を提案する。
提案手法は,暗黒チャネルを組込みガイドマスクとして用いる画像から画像への条件付き生成対向ネットワークに基づいている。
論文 参考訳(メタデータ) (2020-04-19T19:51:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。