論文の概要: PinPoint: Monocular Needle Pose Estimation for Robotic Suturing via Stein Variational Newton and Geometric Residuals
- arxiv url: http://arxiv.org/abs/2603.23365v1
- Date: Tue, 24 Mar 2026 15:59:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 19:53:37.574383
- Title: PinPoint: Monocular Needle Pose Estimation for Robotic Suturing via Stein Variational Newton and Geometric Residuals
- Title(参考訳): PinPoint: ステレオ変分ニュートンと幾何学的残差を用いたロボット縫合のための単眼針位置推定
- Authors: Jesse F. d'Almeida, Tanner Watts, Susheela Sharma Stern, James Ferguson, Alan Kuntz, Robert J. Webster,
- Abstract要約: PinPointは手術針の位置と向きを推定するための確率的変動推論フレームワークである。
実際の針追跡シーケンスでは、PinPointは平均翻訳誤差を80%(1.00 mmまで)、回転誤差を78%(13.80まで)削減する。
単分子の曖昧さが最も重い誘導回転配列では、ピンポイントは2モーダル後部84%を維持している。
- 参考スコア(独自算出の注目度): 3.1332682125418074
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reliable estimation of surgical needle 3D position and orientation is essential for autonomous robotic suturing, yet existing methods operate almost exclusively under stereoscopic vision. In monocular endoscopic settings, common in transendoscopic and intraluminal procedures, depth ambiguity and rotational symmetry render needle pose estimation inherently ill-posed, producing a multimodal distribution over feasible configurations, rather than a single, well-grounded estimate. We present PinPoint, a probabilistic variational inference framework that treats this ambiguity directly, maintaining a distribution of pose hypotheses rather than suppressing it. PinPoint combines monocular image observations with robot-grasp constraints through analytical geometric likelihoods with closed-form Jacobians. This framework enables efficient Gauss-Newton preconditioning in a Stein Variational Newton inference, where second-order particle transport deterministically moves particles toward high-probability regions while kernel-based repulsion preserves diversity in the multimodal structure. On real needle-tracking sequences, PinPoint reduces mean translational error by 80% (down to 1.00 mm) and rotational error by 78% (down to 13.80°) relative to a particle-filter baseline, with substantially better-calibrated uncertainty. On induced-rotation sequences, where monocular ambiguity is most severe, PinPoint maintains a bimodal posterior 84% of the time, almost three times the rate of the particle filter baseline, correctly preserving the alternative hypothesis rather than committing prematurely to one mode. Suturing experiments in ex vivo tissue demonstrate stable tracking through intermittent occlusion, with average errors during occlusion of 1.34 mm in translation and 19.18° in rotation, even when the needle is fully embedded.
- Abstract(参考訳): 手術針の3D位置と向きの信頼性は自律的なロボット縫合に不可欠であるが、既存の方法は立体視下でのみ動作する。
鏡視下手術や鏡内手術に共通する単眼内視鏡では、奥行きのあいまいさと回転対称性の描画針は本質的に不適切な姿勢を呈し、単一で十分な推定値ではなく、実現可能な構成上の多重モード分布を生成する。
我々は、この曖昧さを直接扱う確率的変動推論フレームワークであるPinPointを紹介し、それを抑制するのではなく、ポーズ仮説の分布を維持する。
PinPoint は単分子画像観察とロボットグラフの制約を解析的幾何確率と閉形式のヤコビアンによって組み合わせる。
このフレームワークは、2階粒子輸送が決定的に高確率領域へ粒子を移動させ、カーネルベースの反発はマルチモーダル構造における多様性を保ちながら、効率的なガウス・ニュートン前処理を可能にする。
実際の針追跡シーケンスでは、PinPointは平均翻訳誤差を80%(1.00 mmまで)、回転誤差を78%(13.80°まで)削減する。
単分子の曖昧さが最も深刻である誘導回転配列では、ピンポイントは2モードの後方84%を維持し、粒子フィルターのベースラインの約3倍の速度で、早期に1つのモードにコミットするのではなく、代替仮説を正しく保存する。
生体外組織における持続的な実験では、断続的閉塞による安定した追跡が示され、針が完全に埋め込まれた場合でも、1.34mmの翻訳における閉塞と19.18°の回転における平均誤差が示される。
関連論文リスト
- Towards Scalable Probabilistic Human Motion Prediction with Gaussian Processes for Safe Human-Robot Collaboration [6.846949601451734]
本研究では,フルボディ動作予測のための構造化変分ガウスプロセス(GP)フレームワークを提案する。
我々のモデルは、強いベースラインよりも最大50のカーネル密度推定負対数類似度(KDE NLL)を達成する。
確率的定式化にもかかわらず、我々のモデルは0.24-0.35Mのパラメータしか必要としない。
論文 参考訳(メタデータ) (2026-03-07T08:11:46Z) - Fluoroscopy-Constrained Magnetic Robot Control via Zernike-Based Field Modeling and Nonlinear MPC [4.093982213892736]
磁気アクチュエータにより、手術ロボットは複雑な解剖経路をナビゲートし、組織外傷を軽減し、手術精度を向上させることができる。
本稿では,非線形モデル予測制御フレームワークを組み合わせることで,そのような条件下での高精度かつ安定な制御フレームワークを提案する。
硬膜外空間における薬物伝達を再現する3Dプリント流体作業空間と脊椎ファントムの2つの磁気ロボットを用いて実験的に検証を行った。
論文 参考訳(メタデータ) (2026-02-17T04:50:18Z) - A Concept of Two-Point Propagation Field of a Single Photon: A Way to Picometer X-ray Displacement Sensing and Nanometer Resolution 3D X-ray Micro-Tomography [0.0]
2点伝搬場(TPPF)は単光子検出確率の関数微分である。
構造は、15 pmの精度でショットノイズに制限された変位検知を可能にする。
論文 参考訳(メタデータ) (2025-12-19T18:10:45Z) - Departures: Distributional Transport for Single-Cell Perturbation Prediction with Neural Schrödinger Bridges [51.83259180910313]
遺伝子機能解析における大きなボトルネックは、単細胞データの未成熟の性質である。
我々は、SB(Schrdinger Bridge)を近似して、単セル摂動データに対処する。
本モデルは,異種単一セル応答を効果的に捉え,最先端の性能を実現する。
論文 参考訳(メタデータ) (2025-11-17T08:27:13Z) - Pose-Free 3D Quantitative Phase Imaging of Flowing Cellular Populations [11.956999773396054]
高速断層撮影のためのポーズレス3D再構成フレームワークであるOmniFHTを紹介する。
各細胞の未知の回転構造と体積構造を共同最適化することにより、OmniFHTは任意のセルジオメトリーと多軸回転をサポートする。
その連続表現はまた、わずかにサンプリングされた射影からの正確な再構成を可能にする。
論文 参考訳(メタデータ) (2025-09-05T06:58:39Z) - Adaptive Dual Uncertainty Optimization: Boosting Monocular 3D Object Detection under Test-Time Shifts [80.32933059529135]
TTA(Test-Time Adaptation)メソッドが出現し、推論中にターゲット分布に適応する。
我々は、堅牢なM3ODの両不確実性を共同で最小化するために設計された、最初のTTAフレームワークであるDual Uncertainity Optimization (DUO)を提案する。
並列に,明瞭な意味的手がかりを持つ領域における幾何学的コヒーレンスを保存する意味認識型正規場制約を設計する。
論文 参考訳(メタデータ) (2025-08-28T07:09:21Z) - NIKI: Neural Inverse Kinematics with Invertible Neural Networks for 3D
Human Pose and Shape Estimation [53.25973084799954]
両方向誤差をモデル化したNIKI(Neural Inverse Kinematics with Invertible Neural Network)を提案する。
NIKIは、非可逆ネットワークによる前処理と逆処理の両方から学習することができる。
論文 参考訳(メタデータ) (2023-05-15T12:13:24Z) - Composed Image Retrieval with Text Feedback via Multi-grained
Uncertainty Regularization [73.04187954213471]
粗い検索ときめ細かい検索を同時にモデル化する統合学習手法を提案する。
提案手法は、強いベースラインに対して+4.03%、+3.38%、+2.40%のRecall@50精度を達成した。
論文 参考訳(メタデータ) (2022-11-14T14:25:40Z) - Orthogonal Matrix Retrieval with Spatial Consensus for 3D Unknown-View
Tomography [58.60249163402822]
未知視トモグラフィ(UVT)は、未知のランダムな向きで2次元投影から3次元密度マップを再構成する。
提案したOMRはより堅牢で、従来の最先端のOMRアプローチよりも大幅に性能が向上している。
論文 参考訳(メタデータ) (2022-07-06T21:40:59Z) - Robust Self-Supervised Learning of Deterministic Errors in Single-Plane
(Monoplanar) and Dual-Plane (Biplanar) X-ray Fluoroscopy [2.7528170226206443]
ビデオフレームレートでX線像を撮影する蛍光画像は、血管外科医や介入放射線技師によるカテーテル挿入を導くのに有利である。
ダイナミックな動きを非侵襲的に可視化することで、複雑な手術を患者に対してより少ない外傷で行うことができる。
本稿では,単平面および二重平面蛍光法に適した頑健な自己校正アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-01-03T01:56:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。