論文の概要: Depth-Driven Geometric Prompt Learning for Laparoscopic Liver Landmark Detection
- arxiv url: http://arxiv.org/abs/2406.17858v2
- Date: Thu, 27 Jun 2024 07:39:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-28 12:59:10.959555
- Title: Depth-Driven Geometric Prompt Learning for Laparoscopic Liver Landmark Detection
- Title(参考訳): 腹腔鏡下肝ランドマーク検出のための深さ駆動型幾何学的プロンプト学習
- Authors: Jialun Pei, Ruize Cui, Yaoqian Li, Weixin Si, Jing Qin, Pheng-Ann Heng,
- Abstract要約: 肝臓の解剖学的ランドマークは、2D-3Dアライメントの重要なマーカーである。
腹腔鏡下肝所見の検出を容易にするため,L3Dと呼ばれる新しいデータセットを収集した。
本稿では,D2GPLandという深度駆動型幾何学的プロンプト学習ネットワークを提案する。
- 参考スコア(独自算出の注目度): 43.600236988802465
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Laparoscopic liver surgery poses a complex intraoperative dynamic environment for surgeons, where remains a significant challenge to distinguish critical or even hidden structures inside the liver. Liver anatomical landmarks, e.g., ridge and ligament, serve as important markers for 2D-3D alignment, which can significantly enhance the spatial perception of surgeons for precise surgery. To facilitate the detection of laparoscopic liver landmarks, we collect a novel dataset called L3D, which comprises 1,152 frames with elaborated landmark annotations from surgical videos of 39 patients across two medical sites. For benchmarking purposes, 12 mainstream detection methods are selected and comprehensively evaluated on L3D. Further, we propose a depth-driven geometric prompt learning network, namely D2GPLand. Specifically, we design a Depth-aware Prompt Embedding (DPE) module that is guided by self-supervised prompts and generates semantically relevant geometric information with the benefit of global depth cues extracted from SAM-based features. Additionally, a Semantic-specific Geometric Augmentation (SGA) scheme is introduced to efficiently merge RGB-D spatial and geometric information through reverse anatomic perception. The experimental results indicate that D2GPLand obtains state-of-the-art performance on L3D, with 63.52% DICE and 48.68% IoU scores. Together with 2D-3D fusion technology, our method can directly provide the surgeon with intuitive guidance information in laparoscopic scenarios.
- Abstract(参考訳): 腹腔鏡下肝手術は、外科医にとって複雑な術中動的環境を呈し、肝内の重要な構造や隠れた構造を区別する上で重要な課題である。
肝解剖学的所見(eg, 隆起, 靭帯)は2D-3Dアライメントの重要なマーカーであり, 外科手術の空間的知覚を著しく向上させる。
腹腔鏡下肝所見の検出を容易にするため, 2つの医療施設にわたる39例の手術ビデオから, 1,152 フレームからなる L3D という新しいデータセットを収集した。
ベンチマークのために、12の主流検出方法が選択され、L3Dで包括的に評価される。
さらに,D2GPLandという深度駆動型幾何学的プロンプト学習ネットワークを提案する。
具体的には,DPE(Depth-aware Prompt Embedding)モジュールを設計し,SAMをベースとした特徴から抽出した大域深度キューの利点を活かして,自己教師付きプロンプトで案内し,意味的に関連する幾何学的情報を生成する。
さらに、逆解剖学的知覚を通じてRGB-D空間情報と幾何情報を効率的に統合するために、セマンティック固有幾何拡張(SGA)方式が導入された。
実験結果は、D2GPLandが63.52%のDICEと48.68%のIoUスコアを持つL3Dの最先端のパフォーマンスを得ることを示している。
本手法は2D-3D融合技術と組み合わせて,腹腔鏡下手術例の直感的な指導情報を外科医に直接提供することができる。
関連論文リスト
- An objective comparison of methods for augmented reality in laparoscopic
liver resection by preoperative-to-intraoperative image fusion [33.12510773034339]
腹腔鏡下肝切除のための拡張現実(Augmented reality)は、腹腔鏡下画像上に投射することで、外科医が肝臓内に埋め込まれた腫瘍や血管をローカライズできる可視化モードである。
ほとんどのアルゴリズムは、登録をガイドするために解剖学的ランドマークを使用している。
これらのランドマークには、肝臓の下尾根、ファルシホルムの靭帯、および閉塞輪郭が含まれる。
術中腹腔鏡下固定術(P2ILF)を施行し,これらのランドマークを自動的に検出し,登録する可能性について検討した。
論文 参考訳(メタデータ) (2024-01-28T20:30:14Z) - On the Localization of Ultrasound Image Slices within Point Distribution
Models [84.27083443424408]
甲状腺疾患は高分解能超音波(US)で診断されることが多い
縦断追跡は病理甲状腺形態の変化をモニタリングするための重要な診断プロトコルである。
3次元形状表現におけるUS画像の自動スライスローカライズのためのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-01T10:10:46Z) - A geometry-aware deep network for depth estimation in monocular
endoscopy [17.425158094539462]
提案手法は,異なるデータセットと臨床画像にまたがって広範囲に検証されている。
提案法の平均RMSE値は12.604(T1-L1)、9.930(T2-L2)、13.893(Colon)である。
論文 参考訳(メタデータ) (2023-04-20T11:59:32Z) - Agent with Tangent-based Formulation and Anatomical Perception for
Standard Plane Localization in 3D Ultrasound [56.7645826576439]
3D USにおけるSP自動位置決めのための新しい強化学習フレームワークを提案する。
まず、RLにおける接点に基づく問題として、3D USにおけるSP局所化を定式化し、作用空間を再構成する。
第2に、平面探索における非SPとSPの交差する微妙な違いを認識するモデルの能力を高めるための補助的タスク学習戦略を設計する。
論文 参考訳(メタデータ) (2022-07-01T14:53:27Z) - A unified 3D framework for Organs at Risk Localization and Segmentation
for Radiation Therapy Planning [56.52933974838905]
現在の医療ワークフローは、OAR(Organs-at-risk)のマニュアル記述を必要とする
本研究は,OARローカライゼーション・セグメンテーションのための統合された3Dパイプラインの導入を目的とする。
提案手法は医用画像に固有の3Dコンテキスト情報の活用を可能にする。
論文 参考訳(メタデータ) (2022-03-01T17:08:41Z) - Simulating Realistic MRI variations to Improve Deep Learning model and
visual explanations using GradCAM [0.0]
修正されたHighRes3DNetモデルを用いて、脳MRIボリュームランドマーク検出問題を解く。
Grad-CAMは、モデルがフォーカスしている領域を示す粗いローカライゼーションマップを生成する。
論文 参考訳(メタデータ) (2021-11-01T11:14:23Z) - Stereo Dense Scene Reconstruction and Accurate Laparoscope Localization
for Learning-Based Navigation in Robot-Assisted Surgery [37.14020061063255]
微小侵襲手術(MIS)における解剖情報と腹腔鏡位置の計算はロボット支援手術ナビゲーションの基本ブロックである
本稿では,複雑な解剖学的構造の3次元再構成による画像誘導腹腔鏡像の局在化を実現するための学習駆動型フレームワークを提案する。
論文 参考訳(メタデータ) (2021-10-08T06:12:18Z) - 3-Dimensional Deep Learning with Spatial Erasing for Unsupervised
Anomaly Segmentation in Brain MRI [55.97060983868787]
我々は,MRIボリュームと空間消去を組み合わせた空間文脈の増大が,教師なしの異常セグメンテーション性能の向上に繋がるかどうかを検討する。
本稿では,2次元変分オートエンコーダ(VAE)と3次元の相違点を比較し,3次元入力消去を提案し,データセットサイズが性能に与える影響を体系的に検討する。
入力消去による最高の3D VAEは、平均DICEスコアが31.40%となり、2D VAEは25.76%となった。
論文 参考訳(メタデータ) (2021-09-14T09:17:27Z) - PAENet: A Progressive Attention-Enhanced Network for 3D to 2D Retinal
Vessel Segmentation [0.0]
光コヒーレンス・トモグラフィー(OCTA)画像では3次元から2次元の網膜血管セグメンテーションは難しい問題である。
本稿では,多機能表現を抽出するアテンション機構に基づくプログレッシブ・アテンション・エンハンスメント・ネットワーク(PAENet)を提案する。
提案アルゴリズムは,従来の手法と比較して最先端性能を実現する。
論文 参考訳(メタデータ) (2021-08-26T10:27:25Z) - Improving Point Cloud Semantic Segmentation by Learning 3D Object
Detection [102.62963605429508]
ポイントクラウドセマンティックセグメンテーションは、自動運転において重要な役割を果たす。
現在の3Dセマンティックセグメンテーションネットワークは、よく表現されたクラスに対して優れた性能を発揮する畳み込みアーキテクチャに焦点を当てている。
Aware 3D Semantic Detection (DASS) フレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-22T14:17:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。