論文の概要: DD-VNB: A Depth-based Dual-Loop Framework for Real-time Visually Navigated Bronchoscopy
- arxiv url: http://arxiv.org/abs/2403.01683v2
- Date: Fri, 15 Mar 2024 07:25:48 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-18 22:04:23.896219
- Title: DD-VNB: A Depth-based Dual-Loop Framework for Real-time Visually Navigated Bronchoscopy
- Title(参考訳): DD-VNB:Dual-Loop Framework for Real-time Visually Navigated Bronchoscopy
- Authors: Qingyao Tian, Huai Liao, Xinyan Huang, Jian Chen, Zihui Zhang, Bingyu Yang, Sebastien Ourselin, Hongbin Liu,
- Abstract要約: リアルタイムビジュアルナビゲート気管支鏡(DD-VNB)のためのDepth-based Dual-Loopフレームワークを提案する。
DD-VNBフレームワークは、深さ推定とデュアルループローカライゼーションという2つの重要なモジュールを統合している。
患者からのファントムデータとin-vivoデータを用いた実験により,本フレームワークの有効性が示された。
- 参考スコア(独自算出の注目度): 5.8722774441994074
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Real-time 6 DOF localization of bronchoscopes is crucial for enhancing intervention quality. However, current vision-based technologies struggle to balance between generalization to unseen data and computational speed. In this study, we propose a Depth-based Dual-Loop framework for real-time Visually Navigated Bronchoscopy (DD-VNB) that can generalize across patient cases without the need of re-training. The DD-VNB framework integrates two key modules: depth estimation and dual-loop localization. To address the domain gap among patients, we propose a knowledge-embedded depth estimation network that maps endoscope frames to depth, ensuring generalization by eliminating patient-specific textures. The network embeds view synthesis knowledge into a cycle adversarial architecture for scale-constrained monocular depth estimation. For real-time performance, our localization module embeds a fast ego-motion estimation network into the loop of depth registration. The ego-motion inference network estimates the pose change of the bronchoscope in high frequency while depth registration against the pre-operative 3D model provides absolute pose periodically. Specifically, the relative pose changes are fed into the registration process as the initial guess to boost its accuracy and speed. Experiments on phantom and in-vivo data from patients demonstrate the effectiveness of our framework: 1) monocular depth estimation outperforms SOTA, 2) localization achieves an accuracy of Absolute Tracking Error (ATE) of 4.7 $\pm$ 3.17 mm in phantom and 6.49 $\pm$ 3.88 mm in patient data, 3) with a frame-rate approaching video capture speed, 4) without the necessity of case-wise network retraining. The framework's superior speed and accuracy demonstrate its promising clinical potential for real-time bronchoscopic navigation.
- Abstract(参考訳): 気管支鏡のリアルタイム6 DOF局在化は介入品質の向上に不可欠である。
しかし、現在のビジョンベースの技術は、一般化と見えないデータと計算速度のバランスをとるのに苦労している。
本研究では,Dual-Loopフレームワークを用いたリアルタイム視覚ナビゲーション気管支鏡 (DD-VNB) を提案する。
DD-VNBフレームワークは、深さ推定とデュアルループローカライゼーションという2つの重要なモジュールを統合している。
患者間の領域ギャップを解決するために,内視鏡のフレームを深度にマッピングし,患者固有のテクスチャを排除して一般化を確実にする知識埋め込み深度推定ネットワークを提案する。
このネットワークは、ビュー合成知識を、スケール制約された単眼深度推定のためのサイクル逆アーキテクチャに組み込む。
リアルタイムな性能を実現するため,位置決めモジュールは高速なエゴモーション推定ネットワークを深度登録ループに埋め込む。
エゴモーション推論ネットワークは、気管支鏡のポーズ変化を高周波で推定する一方、術前の3Dモデルに対する深さ登録は、絶対的なポーズを周期的に提供する。
具体的には、相対的なポーズ変化を、その精度と速度を高める最初の推測として登録プロセスに入力する。
患者からのファントムデータとin-vivoデータの実験は、我々の枠組みの有効性を実証している。
1)単分子深度推定はSOTAより優れている。
2) 局所化による絶対追跡誤差(ATE)の精度は、ファントムで4.7$\pm$3.17 mm、患者データで6.49$\pm$3.88 mmである。
3)フレームレートがビデオキャプチャ速度に近づく。
4) ケースワイドネットワーク再トレーニングは不要であった。
このフレームワークの速度と精度は、リアルタイム気管支鏡ナビゲーションの有望な臨床可能性を示している。
関連論文リスト
- ALOcc: Adaptive Lifting-based 3D Semantic Occupancy and Cost Volume-based Flow Prediction [89.89610257714006]
既存の手法は、これらのタスクの要求に応えるために高い精度を優先する。
本稿では,3次元セマンティック占有率予測とフロー推定のための一連の改善点を紹介する。
私たちの純粋な時間的アーキテクチャフレームワークであるALOccは、速度と精度の最適なトレードオフを実現しています。
論文 参考訳(メタデータ) (2024-11-12T11:32:56Z) - Inflated 3D Convolution-Transformer for Weakly-supervised Carotid
Stenosis Grading with Ultrasound Videos [12.780908780402516]
自動頸動脈狭窄グレーディング(CSG)のための第1のビデオ分類フレームワークについて紹介する。
弱教師付きCSGのための新しい効果的な映像分類ネットワークを提案する。
本手法は,大容量の頸動脈ビデオデータセットで広く検証されている。
論文 参考訳(メタデータ) (2023-06-05T02:50:06Z) - CSDN: Combing Shallow and Deep Networks for Accurate Real-time
Segmentation of High-definition Intravascular Ultrasound Images [4.062948258086793]
我々は60MHz高分解能IVUS画像の効率的な分割のための2ストリームフレームワークを提案する。
浅いネットワークと深いネットワーク、すなわちCSDNを組み合わせる。
上記の情報を別々に扱うことで、モデルを学習し、精度の高いリアルタイムセグメンテーションを実現することができる。
論文 参考訳(メタデータ) (2023-01-30T14:42:48Z) - Accurate and Real-time Pseudo Lidar Detection: Is Stereo Neural Network
Really Necessary? [6.8067583993953775]
我々は,より強力なステレオマッチング予測器を備えたシステムを開発し,精度向上のための改良手法を提案する。
提案システムは23ミリ秒の計算で最先端のアプローチと競合する精度を達成し,実車用アプリケーションへのデプロイに適した候補であることを示す。
論文 参考訳(メタデータ) (2022-06-28T09:53:00Z) - Unsupervised inter-frame motion correction for whole-body dynamic PET
using convolutional long short-term memory in a convolutional neural network [9.349668170221975]
我々は、フレーム間の身体の動きを補正するための教師なしのディープラーニングベースのフレームワークを開発する。
運動推定ネットワークは、畳み込み長短期記憶層を組み合わせた畳み込みニューラルネットワークである。
トレーニング後,提案したネットワークの動作推定時間は,従来の登録ベースラインの約460倍の速度であった。
論文 参考訳(メタデータ) (2022-06-13T17:38:16Z) - Unsupervised Scale-consistent Depth Learning from Video [131.3074342883371]
本研究では,単眼深度推定器SC-Depthを提案する。
スケール一貫性予測の能力により,我々の単分子学習深層ネットワークは簡単にORB-SLAM2システムに統合可能であることを示す。
提案したハイブリッドPseudo-RGBD SLAMは、KITTIにおいて魅力的な結果を示し、追加のトレーニングなしでKAISTデータセットにうまく一般化する。
論文 参考訳(メタデータ) (2021-05-25T02:17:56Z) - Multi-view Depth Estimation using Epipolar Spatio-Temporal Networks [87.50632573601283]
一つのビデオから多視点深度を推定する新しい手法を提案する。
提案手法は,新しいEpipolar Spatio-Temporal Transformer(EST)を用いて時間的コヒーレントな深度推定を行う。
最近のMixture-of-Expertsモデルにインスパイアされた計算コストを削減するため、我々はコンパクトなハイブリッドネットワークを設計する。
論文 参考訳(メタデータ) (2020-11-26T04:04:21Z) - Enhancing Fiber Orientation Distributions using convolutional Neural
Networks [0.0]
商業的に取得したMRIにおけるFODの改善について学ぶ。
パッチベースの3次元畳み込みニューラルネットワーク(CNN)の評価
本手法により,シングルシェルdMRI取得プロトコル上でのCDDモデル推定が可能となる。
論文 参考訳(メタデータ) (2020-08-12T16:06:25Z) - 4D Spatio-Temporal Convolutional Networks for Object Position Estimation
in OCT Volumes [69.62333053044712]
3次元畳み込みニューラルネットワーク(CNN)は、単一のOCT画像を用いたマーカーオブジェクトのポーズ推定に有望な性能を示した。
我々は3次元CNNを4次元時間CNNに拡張し、マーカーオブジェクト追跡のための追加の時間情報の影響を評価する。
論文 参考訳(メタデータ) (2020-07-02T12:02:20Z) - AutoHR: A Strong End-to-end Baseline for Remote Heart Rate Measurement
with Neural Searching [76.4844593082362]
既存のエンド・ツー・エンドのネットワークが難易度が低い理由を考察し,アーキテクチャ・サーチ(NAS)を用いたリモートHR計測のための強力なベースラインを確立する。
総合的な実験は、時間内テストとクロスデータセットテストの両方で3つのベンチマークデータセットで実施される。
論文 参考訳(メタデータ) (2020-04-26T05:43:21Z) - Depthwise Non-local Module for Fast Salient Object Detection Using a
Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。
提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文 参考訳(メタデータ) (2020-01-22T15:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。