論文の概要: Monocular Depth Guided Occlusion-Aware Disparity Refinement via Semi-supervised Learning in Laparoscopic Images
- arxiv url: http://arxiv.org/abs/2505.08178v1
- Date: Tue, 13 May 2025 02:29:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-14 20:57:54.398328
- Title: Monocular Depth Guided Occlusion-Aware Disparity Refinement via Semi-supervised Learning in Laparoscopic Images
- Title(参考訳): 腹腔鏡画像における半教師あり学習による単眼深度誘導オクルージョン認識の差分補正
- Authors: Ziteng Liu, Dongdong He, Chenghong Zhang, Wenpeng Gao, Yili Fu,
- Abstract要約: 立体腹腔鏡画像の偏差推定には,咬合とラベル付き手術データの不足が重要な課題である。
これらの課題に対処するために,DGORNet(Depth Guided Occlusion-Aware Disparity Refinement Network)を提案する。
位置埋め込み(PE)モジュールは、空間的コンテキストを明示的に提供し、機能をローカライズし洗練するネットワークの能力を高めるために導入された。
SCAREDデータセットの実験では、DGORNetは End-Point Error (EPE) と Root Mean Squared Error (RMSE) で最先端の手法より優れていることが示された。
- 参考スコア(独自算出の注目度): 7.765272785122932
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Occlusion and the scarcity of labeled surgical data are significant challenges in disparity estimation for stereo laparoscopic images. To address these issues, this study proposes a Depth Guided Occlusion-Aware Disparity Refinement Network (DGORNet), which refines disparity maps by leveraging monocular depth information unaffected by occlusion. A Position Embedding (PE) module is introduced to provide explicit spatial context, enhancing the network's ability to localize and refine features. Furthermore, we introduce an Optical Flow Difference Loss (OFDLoss) for unlabeled data, leveraging temporal continuity across video frames to improve robustness in dynamic surgical scenes. Experiments on the SCARED dataset demonstrate that DGORNet outperforms state-of-the-art methods in terms of End-Point Error (EPE) and Root Mean Squared Error (RMSE), particularly in occlusion and texture-less regions. Ablation studies confirm the contributions of the Position Embedding and Optical Flow Difference Loss, highlighting their roles in improving spatial and temporal consistency. These results underscore DGORNet's effectiveness in enhancing disparity estimation for laparoscopic surgery, offering a practical solution to challenges in disparity estimation and data limitations.
- Abstract(参考訳): 立体腹腔鏡画像の偏差推定には,咬合とラベル付き手術データの不足が重要な課題である。
これらの課題に対処するために, 隠蔽の影響を受けない単眼深度情報を活用することにより, 分散マップを改良するDGORNet(Depth Guided Occlusion-Aware Disparity Refinement Network)を提案する。
位置埋め込み(PE)モジュールは、空間的コンテキストを明示的に提供し、機能をローカライズし洗練するネットワークの能力を高めるために導入された。
さらに,ビデオフレーム間の時間的連続性を活用し,ダイナミックな手術シーンの堅牢性を向上させる光学的フロー差分損失(OFDLoss)を導入する。
SCAREDデータセットの実験では、DGORNetは、エンドポイントエラー(EPE)とルート平均正方形エラー(RMSE)の観点から、特に閉塞領域とテクスチャレス領域において、最先端のメソッドよりも優れています。
アブレーション研究は、位置埋め込みと光フロー差損失の寄与を確認し、空間的および時間的整合性の改善におけるそれらの役割を強調している。
これらの結果は,腹腔鏡下手術におけるDGORNetの有効性を裏付けるものである。
関連論文リスト
- Federated Learning with LoRA Optimized DeiT and Multiscale Patch Embedding for Secure Eye Disease Recognition [2.1358421658740214]
本研究では,AIを用いた医用イメージングと疾患検出を先進的に進めるために,データ効率画像変換器(DeIT)を用いたアプローチを提案する。
AUC、F1スコア、精度、最小損失、トップ5の精度で最先端のパフォーマンスを実現している。
Grad-CAM++視覚化は、重要な病理領域を強調し、モデルの臨床的関連性を高めることにより、解釈可能性を向上させる。
論文 参考訳(メタデータ) (2025-05-11T13:51:56Z) - Occlusion-Aware Self-Supervised Monocular Depth Estimation for Weak-Texture Endoscopic Images [1.1084686909647639]
内視鏡的シーンに適した自己教師付き単眼深度推定ネットワークを提案する。
既存の方法は正確ではあるが、通常は一貫した照明を仮定する。
これらの変化は、誤った幾何学的解釈と信頼できない自己監督信号をもたらす。
論文 参考訳(メタデータ) (2025-04-24T14:12:57Z) - Comprehensive Evaluation of OCT-based Automated Segmentation of Retinal Layer, Fluid and Hyper-Reflective Foci: Impact on Diabetic Retinopathy Severity Assessment [0.0]
糖尿病網膜症(DR)は視覚障害の主要な原因であり、不可逆的な損傷を防ぐために早期かつ正確な評価が必要である。
本研究では,網膜層の自動セグメンテーションのための能動的学習に基づくディープラーニングパイプラインを提案する。
論文 参考訳(メタデータ) (2025-03-03T07:23:56Z) - DPMesh: Exploiting Diffusion Prior for Occluded Human Mesh Recovery [71.6345505427213]
DPMeshは、人間のメッシュリカバリを排除した革新的なフレームワークである。
これは、事前訓練されたテキスト・ツー・イメージ拡散モデルに埋め込まれた対象構造と空間的関係について、より深い拡散に乗じる。
論文 参考訳(メタデータ) (2024-04-01T18:59:13Z) - Eye-gaze Guided Multi-modal Alignment for Medical Representation Learning [65.54680361074882]
アイゲイズガイドマルチモーダルアライメント(EGMA)フレームワークは、アイゲイズデータを利用して、医用視覚的特徴とテキスト的特徴のアライメントを改善する。
我々は4つの医療データセット上で画像分類と画像テキスト検索の下流タスクを行う。
論文 参考訳(メタデータ) (2024-03-19T03:59:14Z) - DEFN: Dual-Encoder Fourier Group Harmonics Network for Three-Dimensional Indistinct-Boundary Object Segmentation [6.0920148653974255]
本稿では,学習コーパス内の不明瞭な境界オブジェクトの表現多様性を高めるために,欠陥注入(SDi)を導入する。
そこで我々はDEFN(Dual-Encoder Fourier Group Harmonics Network)を提案する。
論文 参考訳(メタデータ) (2023-11-01T12:33:04Z) - ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z) - A Global and Patch-wise Contrastive Loss for Accurate Automated Exudate
Detection [12.669734891001667]
糖尿病網膜症(DR:diabetic retinopathy)は、視覚障害の主要な原因である。
硬口蓋の早期発見は、糖尿病の治療と視力喪失の予防に役立つDRの同定において重要な役割を担っている。
ハード・エクスデュート・セグメンテーションを最適化する新しい教師付きコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-02-22T17:39:00Z) - Fuzzy Attention Neural Network to Tackle Discontinuity in Airway
Segmentation [67.19443246236048]
気道セグメンテーションは肺疾患の検査、診断、予後に重要である。
いくつかの小型の気道支線(気管支や終端など)は自動セグメンテーションの難しさを著しく増す。
本稿では,新しいファジィアテンションニューラルネットワークと包括的損失関数を備える,気道セグメンテーションの効率的な手法を提案する。
論文 参考訳(メタデータ) (2022-09-05T16:38:13Z) - Unsupervised Instance Segmentation in Microscopy Images via Panoptic
Domain Adaptation and Task Re-weighting [86.33696045574692]
病理組織像における教師なし核分割のためのCycle Consistency Panoptic Domain Adaptive Mask R-CNN(CyC-PDAM)アーキテクチャを提案する。
まず,合成画像中の補助的な生成物を除去するための核塗布機構を提案する。
第二に、ドメイン識別器を持つセマンティックブランチは、パンプトレベルのドメイン適応を実現するように設計されている。
論文 参考訳(メタデータ) (2020-05-05T11:08:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。