論文の概要: Leveraging Synthetic Priors for Monocular Depth Estimation in Specular Surgical Environments
- arxiv url: http://arxiv.org/abs/2512.23786v1
- Date: Mon, 29 Dec 2025 17:29:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-01 23:27:28.170495
- Title: Leveraging Synthetic Priors for Monocular Depth Estimation in Specular Surgical Environments
- Title(参考訳): 特異手術環境における単眼深度推定のための合成優先手法の活用
- Authors: Ankan Aich, Yangming Lee,
- Abstract要約: 既存の自己監督法は、しばしば薄い手術器具と透明な表面の境界崩壊に悩まされる。
本研究は,Depth Anything V2アーキテクチャの高忠実性合成前駆体を活用することで,この問題に対処する。
提案手法は,新しい最先端技術を確立し,98.1%の精度(1.25)を達成し,既存のベースラインと比較して正方形相対誤差を17%以上削減する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate Monocular Depth Estimation (MDE) is critical for robotic surgery but remains fragile in specular, fluid-filled endoscopic environments. Existing self-supervised methods, typically relying on foundation models trained with noisy real-world pseudo-labels, often suffer from boundary collapse on thin surgical tools and transparent surfaces. In this work, we address this by leveraging the high-fidelity synthetic priors of the Depth Anything V2 architecture, which inherently captures precise geometric details of thin structures. We efficiently adapt these priors to the medical domain using Dynamic Vector Low-Rank Adaptation (DV-LORA), minimizing the parameter budget while bridging the synthetic-to-real gap. Additionally, we introduce a physically-stratified evaluation protocol on the SCARED dataset to rigorously quantify performance in high-specularity regimes often masked by aggregate metrics. Our approach establishes a new state-of-the-art, achieving an accuracy (< 1.25) of 98.1% and reducing Squared Relative Error by over 17% compared to established baselines, demonstrating superior robustness in adverse surgical lighting.
- Abstract(参考訳): 正確な単眼深度推定(MDE)は、ロボット手術において重要であるが、スペックルで流体を充填した内視鏡環境では脆弱である。
既存の自己監督手法は、通常、ノイズの多い現実世界の擬似ラベルで訓練された基礎モデルに依存し、しばしば薄い手術器具と透明な表面の境界崩壊に悩まされる。
本研究は, 細部構造の精密な幾何学的詳細を本質的に捉えたDepth Anything V2アーキテクチャの高忠実な合成先行性を活用することで, この問題に対処する。
DV-LORA(Dynamic Vector Low-Rank Adaptation)を用いて,これらの先行情報を医用領域に効率よく適用し,パラメータ予算を最小化し,合成と実のギャップを埋める。
さらに,SCAREDデータセット上に物理的に階層化された評価プロトコルを導入し,集約されたメトリクスによって隠蔽される高特異性体制における性能を厳格に定量化する。
提案手法は,新しい最先端技術を確立し,98.1%の精度を達成し,既存のベースラインに比べて17%以上の正方形相対誤差を低減し,有害な手術照明において優れたロバスト性を示す。
関連論文リスト
- Orthogonal Subspace Decomposition for Generalizable AI-Generated Image Detection [58.87142367781417]
航法的に訓練された検出器は、限定的で単調な偽のパターンに過度に適合する傾向にあり、特徴空間は高度に制約され、低ランクになる。
潜在的な治療法の1つは、ビジョンファウンデーションモデルに事前訓練された知識を取り入れて、機能領域を広げることである。
主要なコンポーネントを凍結し、残ったコンポーネントのみを適用することで、フェイクパターンを学習しながら、トレーニング済みの知識を保存します。
論文 参考訳(メタデータ) (2024-11-23T19:10:32Z) - Advancing Depth Anything Model for Unsupervised Monocular Depth Estimation in Endoscopy [2.906891207990726]
本稿では,Depth Anything Modelのための新しい微調整戦略を提案する。
本手法は本態性に基づく教師なし単眼深度推定フレームワークと統合する。
提案手法は,トレーニング可能なパラメータ数を最小化しつつ,最先端性能を実現する。
論文 参考訳(メタデータ) (2024-09-12T03:04:43Z) - DARES: Depth Anything in Robotic Endoscopic Surgery with Self-supervised Vector-LoRA of the Foundation Model [17.41557655783514]
ロボット内視鏡手術(DARES)におけるDepth Anythingの導入
DAM V2における新しい適応手法であるローランド適応(LoRA)は、自己教師付き単眼深度推定を行う。
近年の最先端の自己監督型単分子深度推定法よりも, 新たな手法が優れていることが検証された。
論文 参考訳(メタデータ) (2024-08-30T17:35:06Z) - CathFlow: Self-Supervised Segmentation of Catheters in Interventional Ultrasound Using Optical Flow and Transformers [66.15847237150909]
縦型超音波画像におけるカテーテルのセグメンテーションのための自己教師型ディープラーニングアーキテクチャを提案する。
ネットワークアーキテクチャは、Attention in Attentionメカニズムで構築されたセグメンテーショントランスフォーマであるAiAReSeg上に構築されている。
我々は,シリコンオルタファントムから収集した合成データと画像からなる実験データセット上で,我々のモデルを検証した。
論文 参考訳(メタデータ) (2024-03-21T15:13:36Z) - Safe Deep RL for Intraoperative Planning of Pedicle Screw Placement [61.28459114068828]
安全な深部強化学習(DRL)に基づく訓練経路計画にリアルタイムな観察を活用するロボット脊椎手術の術中計画手法を提案する。
本手法は,ゴールドスタンダード (GS) 掘削計画に関して,90%の骨貫通を達成できた。
論文 参考訳(メタデータ) (2023-05-09T11:42:53Z) - Negligible effect of brain MRI data preprocessing for tumor segmentation [36.89606202543839]
我々は3つの公開データセットの実験を行い、ディープニューラルネットワークにおける異なる前処理ステップの効果を評価する。
その結果、最も一般的な標準化手順は、ネットワーク性能に何の価値も与えないことが示されている。
画像の規格化に伴う信号分散の低減のため,画像強度正規化手法はモデル精度に寄与しない。
論文 参考訳(メタデータ) (2022-04-11T17:29:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。