論文の概要: SurfSurg6D: Geometry Consistent Dense Correspondence for Textureless Surgical Instrument Pose Estimation
- arxiv url: http://arxiv.org/abs/2605.25598v1
- Date: Mon, 25 May 2026 08:48:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:19.531641
- Title: SurfSurg6D: Geometry Consistent Dense Correspondence for Textureless Surgical Instrument Pose Estimation
- Title(参考訳): SurfSurg6D: テクスチュアレス手術器具ポス推定のための幾何学的距離対応
- Authors: Daiyun Shen, Shuojue Yang, Chang Han Low, Qian Li, Mengya Xu, Qi Dou, Yueming Jin,
- Abstract要約: 手術器具のポーズ推定は、有望な応用に重要な情報を提供する。
我々はまず、このタスクにおけるデータ不足を軽減するために、新しいデータセットSynSurg6Dを構築します。
次に,手術器具のポーズ推定に適した高密度対応フレームワークであるSurfSurg6Dを提案する。
- 参考スコア(独自算出の注目度): 27.083882212802617
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Surgical instrument pose estimation provides crucial information for promising applications, including autonomous robotic surgery, skill assessment, and standardization of surgical workflow. However, this task remains highly challenging due to high precision requirements, frequent occlusions, textureless instruments, scarcity of depth information and very limited annotated data. These constraints often lead to unsatisfactory performance when employing general object pose estimation approaches to surgical scenarios. To address these issues, we first construct a new dataset SynSurg6D, to alleviate the data shortage in this task. We further propose SurfSurg6D, a dense-correspondence framework tailored for surgical instrument pose estimation. Experimental results on the SurgRIPE, EndoVis2018 and SurgPose datasets demonstrate that the introduction of our generated dataset SynSurg6D is able to diversify the pose distributions, thus enhancing the performance of existing approaches. Furthermore, SurfSurg6D outperforms existing methods, providing a robust solution for precise and efficient RGB-only pose estimation.
- Abstract(参考訳): 手術器具のポーズ推定は、自律型ロボット手術、スキルアセスメント、手術ワークフローの標準化など、有望なアプリケーションにとって重要な情報を提供する。
しかし、この課題は、高精度な要求、頻繁な閉塞、テクスチャのない器具、深度情報の不足、そして注釈付きデータが非常に限られているため、非常に困難なままである。
これらの制約は、手術シナリオに対する一般的なオブジェクトのポーズ推定アプローチを採用する場合、しばしば満足のいくパフォーマンスをもたらす。
これらの問題に対処するために、我々はまず、このタスクにおけるデータ不足を軽減するために、新しいデータセットSynSurg6Dを構築します。
さらに,手術器具のポーズ推定に適した高密度対応フレームワークであるSurfSurg6Dを提案する。
SurgRIPE、EndoVis2018、SurgPoseデータセットの実験結果から、生成したデータセットSynSurg6Dの導入により、ポーズ分布の多様化が可能になり、既存のアプローチのパフォーマンスが向上することが示された。
さらに、SurfSurg6Dは既存の手法よりも優れており、正確で効率的なRGBのみのポーズ推定のための堅牢なソリューションを提供する。
関連論文リスト
- Scaling Video Pretraining for Surgical Foundation Models [51.92777479821822]
SurgRecは、スケーラブルで再現可能な、外科的ビデオ理解のための事前学習のレシピだ。
内視鏡,腹腔鏡,白内障,ロボット手術を対象とする10,535ビデオと214.5Mフレームの大規模なコーパスをキュレートした。
論文 参考訳(メタデータ) (2026-03-31T16:31:25Z) - Training-free Detection and 6D Pose Estimation of Unseen Surgical Instruments [45.387920812487465]
本研究は,未確認の手術器具の高精度なマルチビュー6Dポーズ推定のための無トレーニングパイプラインを導入する。
本手法はMVPSPデータセットから実世界の手術データを用いて厳密に評価した。
論文 参考訳(メタデータ) (2026-03-26T09:28:19Z) - A Multi-View Pipeline and Benchmark Dataset for 3D Hand Pose Estimation in Surgery [1.120882117110929]
外科的文脈における3次元手ポーズ推定のための頑健なパイプラインを提案する。
パイプラインは、信頼できる人物検出、全身ポーズ推定、最先端の2Dハンドキーポイント予測を統合する。
68,000枚以上のフレームと3000枚以上の手書き2Dハンドポーズからなる新しい手術用ベンチマークデータセットを導入する。
論文 参考訳(メタデータ) (2026-01-22T12:48:24Z) - SurgPose: Generalisable Surgical Instrument Pose Estimation using Zero-Shot Learning and Stereo Vision [4.749155557874306]
本稿では,手術器具に対する6自由度ポーズ推定パイプラインを提案する。
私たちはFoundationPoseやSAM-6Dといった最先端のゼロショットRGB-Dモデルを活用しています。
ロボットによる最小侵襲手術におけるゼロショットRGB-Dポーズ推定のための新しいベンチマークを設定した。
論文 参考訳(メタデータ) (2025-05-16T16:58:03Z) - Realistic Data Generation for 6D Pose Estimation of Surgical Instruments [4.226502078427161]
手術器具の6次元ポーズ推定は,手術操作の自動実行を可能にするために重要である。
家庭や工業環境では、3Dコンピュータグラフィックスソフトウェアで生成された合成データが、アノテーションコストを最小限に抑える代替手段として示されている。
本稿では,大規模・多様なデータセットの自動生成を可能にする外科ロボティクスのシミュレーション環境の改善を提案する。
論文 参考訳(メタデータ) (2024-06-11T14:59:29Z) - Advancing 6-DoF Instrument Pose Estimation in Variable X-Ray Imaging Geometries [7.630289691590948]
X線システムにおける6-DoFポーズ推定タスクのための汎用的なデータ取得手法を提案する。
提案したYOLOv5-6Dのポーズモデルは、GPU上で42FPSでかなり高速ながら、公開ベンチマーク上での競合的な結果を達成する。
このモデルはADD-S測定値の0.1倍の92.41%を達成し,手術精度の向上と患者の予後向上に有望なアプローチを示す。
論文 参考訳(メタデータ) (2024-05-19T21:35:12Z) - Zero123-6D: Zero-shot Novel View Synthesis for RGB Category-level 6D Pose Estimation [66.3814684757376]
本研究は,RGB 6Dのカテゴリレベルでのポーズ推定を向上するための拡散モデルに基づく新規ビュー合成器の実用性を示す最初の研究であるZero123-6Dを示す。
本手法は,データ要求の低減,ゼロショットカテゴリレベルの6Dポーズ推定タスクにおける深度情報の必要性の除去,およびCO3Dデータセットの実験により定量的に示された性能の向上を示す。
論文 参考訳(メタデータ) (2024-03-21T10:38:18Z) - Cross-Dataset Adaptation for Instrument Classification in Cataract
Surgery Videos [54.1843419649895]
特定のデータセットでこのタスクをうまく実行する最先端モデルでは、別のデータセットでテストすると、パフォーマンスが低下する。
本稿では,Barlow Adaptorと呼ばれる新しいエンドツーエンドのUnsupervised Domain Adaptation (UDA)手法を提案する。
さらに,BFAL(Barlow Feature Alignment Loss)と呼ばれる,異なるドメインにまたがる特徴を整列させる新たな損失を導入する。
論文 参考訳(メタデータ) (2023-07-31T18:14:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。