論文の概要: DD-VNB: A Depth-based Dual-Loop Framework for Real-time Visually
Navigated Bronchoscopy
- arxiv url: http://arxiv.org/abs/2403.01683v1
- Date: Mon, 4 Mar 2024 02:29:02 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-06 20:16:03.087951
- Title: DD-VNB: A Depth-based Dual-Loop Framework for Real-time Visually
Navigated Bronchoscopy
- Title(参考訳): dd-vnb : リアルタイム視覚ナビゲート気管支鏡用奥行き型デュアルループフレームワーク
- Authors: Qingyao Tian, Huai Liao, Xinyan Huang, Jian Chen, Zihui Zhang, Bingyu
Yang, Sebastien Ourselin and Hongbin Liu
- Abstract要約: リアルタイムビジュアルナビゲート気管支鏡(DD-VNB)のためのDepth-based Dual-Loopフレームワークを提案する。
DD-VNBフレームワークは、深さ推定とデュアルループローカライゼーションという2つの重要なモジュールを統合している。
患者からのファントムデータとin-vivoデータを用いた実験により,本フレームワークの有効性が示された。
- 参考スコア(独自算出の注目度): 6.125197644316394
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Real-time 6 DOF localization of bronchoscopes is crucial for enhancing
intervention quality. However, current vision-based technologies struggle to
balance between generalization to unseen data and computational speed. In this
study, we propose a Depth-based Dual-Loop framework for real-time Visually
Navigated Bronchoscopy (DD-VNB) that can generalize across patient cases
without the need of re-training. The DD-VNB framework integrates two key
modules: depth estimation and dual-loop localization. To address the domain gap
among patients, we propose a knowledge-embedded depth estimation network that
maps endoscope frames to depth, ensuring generalization by eliminating
patient-specific textures. The network embeds view synthesis knowledge into a
cycle adversarial architecture for scale-constrained monocular depth
estimation. For real-time performance, our localization module embeds a fast
ego-motion estimation network into the loop of depth registration. The
ego-motion inference network estimates the pose change of the bronchoscope in
high frequency while depth registration against the pre-operative 3D model
provides absolute pose periodically. Specifically, the relative pose changes
are fed into the registration process as the initial guess to boost its
accuracy and speed. Experiments on phantom and in-vivo data from patients
demonstrate the effectiveness of our framework: 1) monocular depth estimation
outperforms SOTA, 2) localization achieves an accuracy of Absolute Tracking
Error (ATE) of 4.7 $\pm$ 3.17 mm in phantom and 6.49 $\pm$ 3.88 mm in patient
data, 3) with a frame-rate approaching video capture speed, 4) without the
necessity of case-wise network retraining. The framework's superior speed and
accuracy demonstrate its promising clinical potential for real-time
bronchoscopic navigation.
- Abstract(参考訳): 気管支鏡のリアルタイム6 DOF局在化は介入品質の向上に不可欠である。
しかし、現在のビジョンベースの技術は、一般化と見えないデータと計算速度のバランスをとるのに苦労している。
そこで本研究では,実時間視覚誘導気管支鏡(dd-vnb)のための奥行きに基づくデュアルループフレームワークを提案する。
DD-VNBフレームワークは2つの重要なモジュールを統合している。
患者間の領域ギャップに対処するために,内視鏡フレームを深度にマッピングし,患者固有のテクスチャを排除して一般化を保証する知識埋め込み深度推定ネットワークを提案する。
このネットワークは、ビュー合成知識をスケール制約された単眼深度推定のためのサイクル逆アーキテクチャに組み込む。
リアルタイムな性能を実現するため,我々は高速なエゴモーション推定ネットワークを深度登録ループに組み込む。
ego-motion inference networkは高頻度での気管支鏡のポーズ変化を推定し、手術前の3dモデルに対する深さ登録は定期的に絶対的なポーズを与える。
特に、相対的なポーズ変化は、初期推測として登録プロセスに反映され、精度と速度が向上する。
phantom と in-vivo の患者データを用いた実験により,本枠組みの有効性が示された。
1)単眼深度推定は sota を上回っている。
2) 定位はファントムで4.7$\pm$ 3.17 mm、患者データで6.49$\pm$ 3.88 mmの絶対追跡誤差(ate)の精度を達成する。
3)フレームレートがビデオキャプチャ速度に近づいている。
4) ケースワイドネットワーク再トレーニングは不要であった。
フレームワークの優れた速度と精度は、リアルタイム気管支鏡ナビゲーションに有望な臨床可能性を示している。
関連論文リスト
- ALOcc: Adaptive Lifting-based 3D Semantic Occupancy and Cost Volume-based Flow Prediction [89.89610257714006]
既存の手法は、これらのタスクの要求に応えるために高い精度を優先する。
本稿では,3次元セマンティック占有率予測とフロー推定のための一連の改善点を紹介する。
私たちの純粋な時間的アーキテクチャフレームワークであるALOccは、速度と精度の最適なトレードオフを実現しています。
論文 参考訳(メタデータ) (2024-11-12T11:32:56Z) - Inflated 3D Convolution-Transformer for Weakly-supervised Carotid
Stenosis Grading with Ultrasound Videos [12.780908780402516]
自動頸動脈狭窄グレーディング(CSG)のための第1のビデオ分類フレームワークについて紹介する。
弱教師付きCSGのための新しい効果的な映像分類ネットワークを提案する。
本手法は,大容量の頸動脈ビデオデータセットで広く検証されている。
論文 参考訳(メタデータ) (2023-06-05T02:50:06Z) - CSDN: Combing Shallow and Deep Networks for Accurate Real-time
Segmentation of High-definition Intravascular Ultrasound Images [4.062948258086793]
我々は60MHz高分解能IVUS画像の効率的な分割のための2ストリームフレームワークを提案する。
浅いネットワークと深いネットワーク、すなわちCSDNを組み合わせる。
上記の情報を別々に扱うことで、モデルを学習し、精度の高いリアルタイムセグメンテーションを実現することができる。
論文 参考訳(メタデータ) (2023-01-30T14:42:48Z) - Accurate and Real-time Pseudo Lidar Detection: Is Stereo Neural Network
Really Necessary? [6.8067583993953775]
我々は,より強力なステレオマッチング予測器を備えたシステムを開発し,精度向上のための改良手法を提案する。
提案システムは23ミリ秒の計算で最先端のアプローチと競合する精度を達成し,実車用アプリケーションへのデプロイに適した候補であることを示す。
論文 参考訳(メタデータ) (2022-06-28T09:53:00Z) - Unsupervised inter-frame motion correction for whole-body dynamic PET
using convolutional long short-term memory in a convolutional neural network [9.349668170221975]
我々は、フレーム間の身体の動きを補正するための教師なしのディープラーニングベースのフレームワークを開発する。
運動推定ネットワークは、畳み込み長短期記憶層を組み合わせた畳み込みニューラルネットワークである。
トレーニング後,提案したネットワークの動作推定時間は,従来の登録ベースラインの約460倍の速度であった。
論文 参考訳(メタデータ) (2022-06-13T17:38:16Z) - Unsupervised Scale-consistent Depth Learning from Video [131.3074342883371]
本研究では,単眼深度推定器SC-Depthを提案する。
スケール一貫性予測の能力により,我々の単分子学習深層ネットワークは簡単にORB-SLAM2システムに統合可能であることを示す。
提案したハイブリッドPseudo-RGBD SLAMは、KITTIにおいて魅力的な結果を示し、追加のトレーニングなしでKAISTデータセットにうまく一般化する。
論文 参考訳(メタデータ) (2021-05-25T02:17:56Z) - Multi-view Depth Estimation using Epipolar Spatio-Temporal Networks [87.50632573601283]
一つのビデオから多視点深度を推定する新しい手法を提案する。
提案手法は,新しいEpipolar Spatio-Temporal Transformer(EST)を用いて時間的コヒーレントな深度推定を行う。
最近のMixture-of-Expertsモデルにインスパイアされた計算コストを削減するため、我々はコンパクトなハイブリッドネットワークを設計する。
論文 参考訳(メタデータ) (2020-11-26T04:04:21Z) - Enhancing Fiber Orientation Distributions using convolutional Neural
Networks [0.0]
商業的に取得したMRIにおけるFODの改善について学ぶ。
パッチベースの3次元畳み込みニューラルネットワーク(CNN)の評価
本手法により,シングルシェルdMRI取得プロトコル上でのCDDモデル推定が可能となる。
論文 参考訳(メタデータ) (2020-08-12T16:06:25Z) - 4D Spatio-Temporal Convolutional Networks for Object Position Estimation
in OCT Volumes [69.62333053044712]
3次元畳み込みニューラルネットワーク(CNN)は、単一のOCT画像を用いたマーカーオブジェクトのポーズ推定に有望な性能を示した。
我々は3次元CNNを4次元時間CNNに拡張し、マーカーオブジェクト追跡のための追加の時間情報の影響を評価する。
論文 参考訳(メタデータ) (2020-07-02T12:02:20Z) - AutoHR: A Strong End-to-end Baseline for Remote Heart Rate Measurement
with Neural Searching [76.4844593082362]
既存のエンド・ツー・エンドのネットワークが難易度が低い理由を考察し,アーキテクチャ・サーチ(NAS)を用いたリモートHR計測のための強力なベースラインを確立する。
総合的な実験は、時間内テストとクロスデータセットテストの両方で3つのベンチマークデータセットで実施される。
論文 参考訳(メタデータ) (2020-04-26T05:43:21Z) - Depthwise Non-local Module for Fast Salient Object Detection Using a
Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。
提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文 参考訳(メタデータ) (2020-01-22T15:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。