論文の概要: Investigating a Policy-Based Formulation for Endoscopic Camera Pose Recovery
- arxiv url: http://arxiv.org/abs/2603.20045v1
- Date: Fri, 20 Mar 2026 15:30:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 19:48:39.207856
- Title: Investigating a Policy-Based Formulation for Endoscopic Camera Pose Recovery
- Title(参考訳): 内視鏡カメラポスリカバリのためのポリシーに基づく定式化の検討
- Authors: Jan Emily Mangulabnan, Akshat Chauhan, Laura Fleig, Lalithkumar Seenivasan, Roger D. Soberanis-Mukul, S. Swaroop Vedula, Russell H. Taylor, Masaru Ishii, Gregory D. Hager, Mathias Unberath,
- Abstract要約: 視覚に基づくナビゲーションシステムは、内視鏡的ビデオから直接カメラのポーズを復元することで、内視鏡的手術を再現しようとしている。
ほとんどのアプローチは、外科医を成功させる新しいフレームについて推論するのと同じ原則を具現化していない。
本研究では,前回のカメラ状態に条件付き軌跡を推定する専門家を模倣した,内視鏡的ポーズ回復のポリシーに基づく定式化を提案する。
- 参考スコア(独自算出の注目度): 13.321458523588626
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In endoscopic surgery, surgeons continuously locate the endoscopic view relative to the anatomy by interpreting the evolving visual appearance of the intraoperative scene in the context of their prior knowledge. Vision-based navigation systems seek to replicate this capability by recovering camera pose directly from endoscopic video, but most approaches do not embody the same principles of reasoning about new frames that makes surgeons successful. Instead, they remain grounded in feature matching and geometric optimization over keyframes, an approach that has been shown to degrade under the challenging conditions of endoscopic imaging like low texture and rapid illumination changes. Here, we pursue an alternative approach and investigate a policy-based formulation of endoscopic camera pose recovery that seeks to imitate experts in estimating trajectories conditioned on the previous camera state. Our approach directly predicts short-horizon relative motions without maintaining an explicit geometric representation at inference time. It thus addresses, by design, some of the notorious challenges of geometry-based approaches, such as brittle correspondence matching, instability in texture-sparse regions, and limited pose coverage due to reconstruction failure. We evaluate the proposed formulation on cadaveric sinus endoscopy. Under oracle state conditioning, we compare short-horizon motion prediction quality to geometric baselines achieving lowest mean translation error and competitive rotational accuracy. We analyze robustness by grouping prediction windows according to texture richness and illumination change indicating reduced sensitivity to low-texture conditions. These findings suggest that a learned motion policy offers a viable alternative formulation for endoscopic camera pose recovery.
- Abstract(参考訳): 内視鏡下手術では,手術シーンの視覚的外観の発達を先行知識の文脈で解釈し,解剖学に対する内視鏡的視界を連続的に特定する。
視覚ベースのナビゲーションシステムは、内視鏡的ビデオから直接カメラのポーズを復元することで、この能力を再現しようとしているが、ほとんどのアプローチは、外科医を成功させる新しいフレームを推論するのと同じ原則を具現化していない。
この手法は、低テクスチャや急激な照明変化といった内視鏡画像の困難な条件下で、分解することが示されている。
そこで,本研究では,従来のカメラ状態の軌跡を推定する専門家を模した,内視鏡的ポーズ回復のポリシーに基づく定式化を追求する。
提案手法は, 推定時刻に明示的な幾何学的表現を保たずに, 短時間の相対運動を直接予測する。
したがって、設計上は、脆い対応マッチング、テクスチャスパース領域の不安定性、再構築失敗による限られたポーズカバレッジなど、幾何学に基づくアプローチの悪名高い課題に対処する。
上顎洞内視鏡検査における提案法について検討した。
オラクル状態条件下では,最小平均翻訳誤差と競合回転精度を達成し,短水平運動予測品質と幾何学的ベースラインを比較した。
低テクスチャ環境に対する感度の低下を示すテクスチャ豊かさと照明変化に応じて、予測ウィンドウをグループ化してロバスト性を分析する。
これらの結果から,学習した動作ポリシーは,内視鏡カメラのポーズ回復に有効な代替の定式化を提供する可能性が示唆された。
関連論文リスト
- Percept-Aware Surgical Planning for Visual Cortical Prostheses with Vascular Avoidance [6.649753747542209]
初期視覚野における電気刺激ニューロンによる視力回復を目的とした皮質視覚補綴(V1)
既存の戦略は視野のカバレッジと解剖学を重視しているが、安全制約の下で予測された知覚結果を直接最適化するものではない。
解剖学的空間における電極配置を制約付き最適化問題として定式化した皮質視覚補綴の外科的計画のための知覚型枠組みを提案する。
論文 参考訳(メタデータ) (2026-02-27T22:59:18Z) - Self-Supervised Contrastive Embedding Adaptation for Endoscopic Image Matching [7.674595072442547]
本研究では,内視鏡画像対の特徴対応性を確立するための新しいディープラーニングパイプラインを提案する。
提案手法は、新しいビュー合成パイプラインを利用して、接地トルース不整合対応を生成する。
パイプラインはSCAREDデータセットの最先端手法を超越し,マッチング精度とエピポーラ誤差の低減を実現した。
論文 参考訳(メタデータ) (2025-12-11T07:44:00Z) - EndoUFM: Utilizing Foundation Models for Monocular depth estimation of endoscopic images [7.350425834778092]
EndoUFMは、教師なしの単眼深度推定フレームワークである。
強力な事前学習先を活用することにより、深さ推定性能を向上させる。
この研究は、最小侵襲の手術において、外科医の空間的知覚を増大させるのに寄与する。
論文 参考訳(メタデータ) (2025-08-25T11:33:05Z) - Benchmarking Laparoscopic Surgical Image Restoration and Beyond [54.28852320829451]
腹腔鏡下手術では、明瞭で高品質な視野が外科医の正確な判断に不可欠である。
持続的な視覚劣化、例えば、エネルギー装置によって発生する煙、熱勾配から光るレンズ、およびレンズ汚染は患者の安全に危険をもたらす。
本稿では,SurgCleanと呼ばれる腹腔鏡下環境を対象とするオープンソースの手術画像復元データセットについて紹介する。
論文 参考訳(メタデータ) (2025-05-25T14:17:56Z) - Deep intra-operative illumination calibration of hyperspectral cameras [73.08443963791343]
ハイパースペクトルイメージング (HSI) は, 様々な手術応用に期待できる新しい画像モダリティとして出現している。
手術室における照明条件の動的変化がHSIアプリケーションの性能に劇的な影響を及ぼすことを示す。
手術中におけるハイパースペクトル画像の自動再構成のための新しい学習ベースアプローチを提案する。
論文 参考訳(メタデータ) (2024-09-11T08:30:03Z) - ToDER: Towards Colonoscopy Depth Estimation and Reconstruction with Geometry Constraint Adaptation [67.22294293695255]
そこで本稿では,ToDERという双方向適応アーキテクチャを用いて,高精度な深度推定を行う新しいパイプラインを提案する。
以上の結果から,本手法は実写および合成大腸内視鏡ビデオの深度マップを精度良く予測できることが示唆された。
論文 参考訳(メタデータ) (2024-07-23T14:24:26Z) - FLex: Joint Pose and Dynamic Radiance Fields Optimization for Stereo Endoscopic Videos [79.50191812646125]
内視鏡的シーンの再構築は、外科手術後の分析から教育訓練まで、様々な医療応用にとって重要な要素である。
変形組織の非常にダイナミックな環境下での移動内視鏡の挑戦的なセットアップに着目する。
複数重重なり合う4次元ニューラルラジアンスフィールド(NeRF)への暗黙的なシーン分離と、再構成とカメラのスクラッチからのポーズを協調的に最適化するプログレッシブ最適化手法を提案する。
これにより、使いやすさが向上し、5000フレーム以上の手術ビデオの処理に間に合うように復元能力を拡張できる。
論文 参考訳(メタデータ) (2024-03-18T19:13:02Z) - A Quantitative Evaluation of Dense 3D Reconstruction of Sinus Anatomy
from Monocular Endoscopic Video [8.32570164101507]
内視鏡的シーケンスと光学的トラッキングを用いた洞再建のための自己教師型アプローチの定量的解析を行った。
以上の結果から, 生成した復元は解剖学的に高い一致を示し, 平均点間誤差は0.91mmであった。
ポーズと深さ推定の不正確さがこの誤りに等しく寄与し、より短い軌跡を持つ局所的に一貫したシーケンスがより正確な再構成をもたらすことを確認した。
論文 参考訳(メタデータ) (2023-10-22T17:11:40Z) - RIDE: Self-Supervised Learning of Rotation-Equivariant Keypoint
Detection and Invariant Description for Endoscopy [83.4885991036141]
RIDEは回転同変検出と不変記述のための学習に基づく手法である。
内視鏡画像の大規模なキュレーションを自己指導的に行う。
マッチングと相対的なポーズ推定タスクに対して、最先端のパフォーマンスを新たに設定する。
論文 参考訳(メタデータ) (2023-09-18T08:16:30Z) - Learning How To Robustly Estimate Camera Pose in Endoscopic Videos [5.073761189475753]
カメラポーズ推定における2つの幾何学的損失を最小限に抑えるために,奥行きと光学的流れを推定するステレオ内視鏡の解を提案する。
最も重要なことは、入力画像の内容に応じてコントリビューションのバランスをとるために、2つの学習された画素単位の重みマッピングを導入することである。
パブリックなSCAREDデータセットに対する我々のアプローチを検証するとともに、新たなインビボデータセットであるStereoMISを導入しています。
論文 参考訳(メタデータ) (2023-04-17T07:05:01Z) - Modeling and Enhancing Low-quality Retinal Fundus Images [167.02325845822276]
低画質の眼底画像は臨床観察における不確実性を高め、誤診のリスクを引き起こす。
本稿では,グローバルな劣化要因を抑えるために,臨床指向の基盤拡張ネットワーク(cofe-Net)を提案する。
合成画像と実画像の両方の実験により、我々のアルゴリズムは網膜の細部を失うことなく、低品質の眼底画像を効果的に補正することを示した。
論文 参考訳(メタデータ) (2020-05-12T08:01:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。