論文の概要: Benchmarking Laparoscopic Surgical Image Restoration and Beyond
- arxiv url: http://arxiv.org/abs/2505.19161v1
- Date: Sun, 25 May 2025 14:17:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:42.942813
- Title: Benchmarking Laparoscopic Surgical Image Restoration and Beyond
- Title(参考訳): 腹腔鏡下画像修復のベンチマーク
- Authors: Jialun Pei, Diandian Guo, Donghui Yang, Zhixi Li, Yuxin Feng, Long Ma, Bo Du, Pheng-Ann Heng,
- Abstract要約: 腹腔鏡下手術では、明瞭で高品質な視野が外科医の正確な判断に不可欠である。
持続的な視覚劣化、例えば、エネルギー装置によって発生する煙、熱勾配から光るレンズ、およびレンズ汚染は患者の安全に危険をもたらす。
本稿では,SurgCleanと呼ばれる腹腔鏡下環境を対象とするオープンソースの手術画像復元データセットについて紹介する。
- 参考スコア(独自算出の注目度): 54.28852320829451
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In laparoscopic surgery, a clear and high-quality visual field is critical for surgeons to make accurate intraoperative decisions. However, persistent visual degradation, including smoke generated by energy devices, lens fogging from thermal gradients, and lens contamination due to blood or tissue fluid splashes during surgical procedures, severely impair visual clarity. These degenerations can seriously hinder surgical workflow and pose risks to patient safety. To systematically investigate and address various forms of surgical scene degradation, we introduce a real-world open-source surgical image restoration dataset covering laparoscopic environments, called SurgClean, which involves multi-type image restoration tasks, e.g., desmoking, defogging, and desplashing. SurgClean comprises 1,020 images with diverse degradation types and corresponding paired reference labels. Based on SurgClean, we establish a standardized evaluation benchmark and provide performance for 22 representative generic task-specific image restoration approaches, including 12 generic and 10 task-specific image restoration approaches. Experimental results reveal substantial performance gaps relative to clinical requirements, highlighting a critical opportunity for algorithm advancements in intelligent surgical restoration. Furthermore, we explore the degradation discrepancies between surgical and natural scenes from structural perception and semantic understanding perspectives, providing fundamental insights for domain-specific image restoration research. Our work aims to empower the capabilities of restoration algorithms to increase surgical environments and improve the efficiency of clinical procedures.
- Abstract(参考訳): 腹腔鏡下手術では,外科医が正確な術中決定を下すためには,明瞭で高品質な視野が不可欠である。
しかし、エネルギー装置によって発生する煙、熱勾配からのレンズの霧、外科手術中に血液や組織液によるレンズの汚染など、持続的な視覚劣化は、視覚的明瞭度を著しく損なう。
これらの変性は、外科的ワークフローを著しく阻害し、患者の安全にリスクをもたらす可能性がある。
様々な形態の外科的シーンの劣化を体系的に調査し対処するために,SurgCleanと呼ばれる腹腔鏡下環境をカバーする実世界のオープンソースの外科的画像復元データセットを導入する。
SurgCleanは、さまざまな劣化タイプと対応するペア参照ラベルを持つ1,020のイメージで構成されている。
SurgCleanをベースとして標準化された評価ベンチマークを構築し,12の汎用および10のタスク固有画像復元アプローチを含む22の汎用タスク固有画像復元手法の性能を提供する。
実験結果から, 臨床要件に対する性能差が顕著であり, 知的外科的修復におけるアルゴリズムの進歩の重要な機会であることが明らかとなった。
さらに、構造的知覚と意味的理解の観点から、外科的シーンと自然シーンの劣化の相違について検討し、ドメイン固有の画像復元研究の基本的な知見を提供する。
本研究は,外科的環境の改善と臨床手術の効率向上を目的とした修復アルゴリズムの能力向上を目的としている。
関連論文リスト
- SurgVisAgent: Multimodal Agentic Model for Versatile Surgical Visual Enhancement [8.337819078911405]
SurgVisAgentはマルチモーダル大言語モデル(MLLM)上に構築されたエンドツーエンドのインテリジェントな手術用視覚エージェントである。
内視鏡画像の歪みカテゴリと重度レベルを動的に識別し、様々な拡張タスクを実行できる。
我々は,SurgVisAgentが従来の単一タスクモデルを上回ることを示す大規模な実験を行い,実世界の外科的歪みをシミュレーションするベンチマークを構築した。
論文 参考訳(メタデータ) (2025-07-03T03:00:26Z) - Surgical Foundation Model Leveraging Compression and Entropy Maximization for Image-Guided Surgical Assistance [50.486523249499115]
低侵襲手術(MIS)におけるリアルタイム映像理解の重要性
手術ビデオからコンパクトで情報的表現を学習するための,新しい自己教師型フレームワークであるCompress-to-Explore (C2E)を提案する。
C2Eは、エントロピー最大化デコーダを使用して、臨床的に関連する詳細を保持しながら画像を圧縮し、ラベル付きデータなしでエンコーダのパフォーマンスを向上させる。
論文 参考訳(メタデータ) (2025-05-16T14:02:24Z) - SURGIVID: Annotation-Efficient Surgical Video Object Discovery [42.16556256395392]
手術シーンのセマンティックセグメンテーションのためのアノテーション効率のよいフレームワークを提案する。
我々は,画像に基づく自己監督型物体発見法を用いて,外科的ビデオにおいて最も有能なツールや解剖学的構造を同定する。
完全教師付きセグメンテーションモデルを用いて,36のアノテーションラベルで強化した無教師付きセットアップでは,同程度のローカライゼーション性能を示す。
論文 参考訳(メタデータ) (2024-09-12T07:12:20Z) - Deep intra-operative illumination calibration of hyperspectral cameras [73.08443963791343]
ハイパースペクトルイメージング (HSI) は, 様々な手術応用に期待できる新しい画像モダリティとして出現している。
手術室における照明条件の動的変化がHSIアプリケーションの性能に劇的な影響を及ぼすことを示す。
手術中におけるハイパースペクトル画像の自動再構成のための新しい学習ベースアプローチを提案する。
論文 参考訳(メタデータ) (2024-09-11T08:30:03Z) - Step-Calibrated Diffusion for Biomedical Optical Image Restoration [47.191704042917394]
再生ステップ校正拡散(Resorative Step-Calibrated Diffusion、RSCD)は、拡散に基づく画像復元法である。
RSCDは、画像品質と知覚評価の両方において、他の広く使われている未使用画像復元方法よりも優れている。
RSCDは、自動脳腫瘍診断や深部組織イメージングなど、下流の臨床画像タスクのパフォーマンスを改善する。
論文 参考訳(メタデータ) (2024-03-20T15:38:53Z) - Navigating the Synthetic Realm: Harnessing Diffusion-based Models for
Laparoscopic Text-to-Image Generation [3.2039076408339353]
拡散型生成モデルを用いて短いテキストプロンプトから合成腹腔鏡画像を生成するための直感的なアプローチを提案する。
画像ガイド下手術の分野では,拡散モデルがスタイルやセマンティクスの知識を得ることができた。
論文 参考訳(メタデータ) (2023-12-05T16:20:22Z) - Action Recognition in Video Recordings from Gynecologic Laparoscopy [4.002010889177872]
行動認識は腹腔鏡画像解析における多くの応用の前提条件である。
本研究では,CNN-RNNアーキテクチャと,カスタマイズしたトレーニング推論フレームワークの設計と評価を行う。
論文 参考訳(メタデータ) (2023-11-30T16:15:46Z) - CholecTriplet2021: A benchmark challenge for surgical action triplet
recognition [66.51610049869393]
腹腔鏡下手術における三肢の認識のためにMICCAI 2021で実施した内視鏡的視力障害であるColecTriplet 2021を提案する。
課題の参加者が提案する最先端の深層学習手法の課題設定と評価について述べる。
4つのベースライン法と19の新しいディープラーニングアルゴリズムが提示され、手術ビデオから直接手術行動三重項を認識し、平均平均精度(mAP)は4.2%から38.1%である。
論文 参考訳(メタデータ) (2022-04-10T18:51:55Z) - Modeling and Enhancing Low-quality Retinal Fundus Images [167.02325845822276]
低画質の眼底画像は臨床観察における不確実性を高め、誤診のリスクを引き起こす。
本稿では,グローバルな劣化要因を抑えるために,臨床指向の基盤拡張ネットワーク(cofe-Net)を提案する。
合成画像と実画像の両方の実験により、我々のアルゴリズムは網膜の細部を失うことなく、低品質の眼底画像を効果的に補正することを示した。
論文 参考訳(メタデータ) (2020-05-12T08:01:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。