Fugu-MT 論文翻訳(概要): DD-VNB: A Depth-based Dual-Loop Framework for Real-time Visually Navigated Bronchoscopy

論文の概要: DD-VNB: A Depth-based Dual-Loop Framework for Real-time Visually Navigated Bronchoscopy

arxiv url: http://arxiv.org/abs/2403.01683v1
Date: Mon, 4 Mar 2024 02:29:02 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-06 20:16:03.087951
Title: DD-VNB: A Depth-based Dual-Loop Framework for Real-time Visually Navigated Bronchoscopy
Title（参考訳）: dd-vnb : リアルタイム視覚ナビゲート気管支鏡用奥行き型デュアルループフレームワーク
Authors: Qingyao Tian, Huai Liao, Xinyan Huang, Jian Chen, Zihui Zhang, Bingyu Yang, Sebastien Ourselin and Hongbin Liu
Abstract要約: リアルタイムビジュアルナビゲート気管支鏡(DD-VNB)のためのDepth-based Dual-Loopフレームワークを提案する。 DD-VNBフレームワークは、深さ推定とデュアルループローカライゼーションという2つの重要なモジュールを統合している。患者からのファントムデータとin-vivoデータを用いた実験により,本フレームワークの有効性が示された。
参考スコア（独自算出の注目度）: 6.125197644316394
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Real-time 6 DOF localization of bronchoscopes is crucial for enhancing intervention quality. However, current vision-based technologies struggle to balance between generalization to unseen data and computational speed. In this study, we propose a Depth-based Dual-Loop framework for real-time Visually Navigated Bronchoscopy (DD-VNB) that can generalize across patient cases without the need of re-training. The DD-VNB framework integrates two key modules: depth estimation and dual-loop localization. To address the domain gap among patients, we propose a knowledge-embedded depth estimation network that maps endoscope frames to depth, ensuring generalization by eliminating patient-specific textures. The network embeds view synthesis knowledge into a cycle adversarial architecture for scale-constrained monocular depth estimation. For real-time performance, our localization module embeds a fast ego-motion estimation network into the loop of depth registration. The ego-motion inference network estimates the pose change of the bronchoscope in high frequency while depth registration against the pre-operative 3D model provides absolute pose periodically. Specifically, the relative pose changes are fed into the registration process as the initial guess to boost its accuracy and speed. Experiments on phantom and in-vivo data from patients demonstrate the effectiveness of our framework: 1) monocular depth estimation outperforms SOTA, 2) localization achieves an accuracy of Absolute Tracking Error (ATE) of 4.7 $\pm$ 3.17 mm in phantom and 6.49 $\pm$ 3.88 mm in patient data, 3) with a frame-rate approaching video capture speed, 4) without the necessity of case-wise network retraining. The framework's superior speed and accuracy demonstrate its promising clinical potential for real-time bronchoscopic navigation.
Abstract（参考訳）: 気管支鏡のリアルタイム6 DOF局在化は介入品質の向上に不可欠である。しかし、現在のビジョンベースの技術は、一般化と見えないデータと計算速度のバランスをとるのに苦労している。そこで本研究では,実時間視覚誘導気管支鏡(dd-vnb)のための奥行きに基づくデュアルループフレームワークを提案する。 DD-VNBフレームワークは2つの重要なモジュールを統合している。患者間の領域ギャップに対処するために,内視鏡フレームを深度にマッピングし,患者固有のテクスチャを排除して一般化を保証する知識埋め込み深度推定ネットワークを提案する。このネットワークは、ビュー合成知識をスケール制約された単眼深度推定のためのサイクル逆アーキテクチャに組み込む。リアルタイムな性能を実現するため,我々は高速なエゴモーション推定ネットワークを深度登録ループに組み込む。 ego-motion inference networkは高頻度での気管支鏡のポーズ変化を推定し、手術前の3dモデルに対する深さ登録は定期的に絶対的なポーズを与える。特に、相対的なポーズ変化は、初期推測として登録プロセスに反映され、精度と速度が向上する。 phantom と in-vivo の患者データを用いた実験により,本枠組みの有効性が示された。 1)単眼深度推定は sota を上回っている。 2) 定位はファントムで4.7$\pm$ 3.17 mm、患者データで6.49$\pm$ 3.88 mmの絶対追跡誤差(ate)の精度を達成する。 3)フレームレートがビデオキャプチャ速度に近づいている。 4) ケースワイドネットワーク再トレーニングは不要であった。フレームワークの優れた速度と精度は、リアルタイム気管支鏡ナビゲーションに有望な臨床可能性を示している。

関連論文リスト

CT Scans As Video: Efficient Intracranial Hemorrhage Detection Using Multi-Object Tracking [0.9332987715848716]
本稿では,2次元検出の効率と3次元コンテキストの必要性を両立させる軽量コンピュータビジョンフレームワークを開発する。計算コストのごく一部で3Dコンテキスト推論を近似することにより,リアルタイム患者優先化のためのスケーラブルなソリューションを提供する。
論文参考訳（メタデータ） (2026-01-05T19:49:51Z)
EndoStreamDepth: Temporally Consistent Monocular Depth Estimation for Endoscopic Video Streams [6.300100115696222]
本研究では,内視鏡的ビデオストリームのための単眼深度推定フレームワークであるEndoStreamDepthを紹介する。フレームごとに鋭い解剖学的境界を持つ正確な深度マップ、フレーム間の時間的に一貫した予測、リアルタイムスループットを提供する。
論文参考訳（メタデータ） (2025-12-20T00:53:30Z)
Video Depth Propagation [54.523028170425256]
既存の手法は単純なフレーム・バイ・フレームの単分子モデルに依存しており、時間的矛盾と不正確な結果をもたらす。本稿では,オンラインビデオパイプラインを効果的に活用し,深い特徴伝達を行うVeloDepthを提案する。構造的に時間的整合性を強制し, 連続するフレーム間に安定した深さ予測を行い, 効率を向上する。
論文参考訳（メタデータ） (2025-12-11T15:08:37Z)
Enhanced Landmark Detection Model in Pelvic Fluoroscopy using 2D/3D Registration Loss [1.6420503030062876]
U-Netランドマーク予測モデルのトレーニングに2D/3Dランドマーク登録を組み込んだ新しいフレームワークを提案する。実際の術中条件下では,ベースラインのU-Net,Pose Estimation Lossで訓練したU-Net,Pose Estimation Lossで微調整したU-Netのランドマーク検出精度を比較して,性能差を解析した。
論文参考訳（メタデータ） (2025-11-26T16:50:06Z)
BronchOpt : Vision-Based Pose Optimization with Fine-Tuned Foundation Models for Accurate Bronchoscopy Navigation [6.915058920280426]
術中内視鏡視と術前CT解剖の2D-3D登録のための視覚ベースのポーズ最適化フレームワークを提案する。細調整されたモダリティおよびドメイン不変エンコーダは、実際の内視鏡的RGBフレームとCTレンダリング深度マップとの直接的な類似性を実現する。本モデルでは, 平均翻訳誤差2.65mm, 回転誤差0.19radを実現し, 高精度かつ安定な局所化を示す。
論文参考訳（メタデータ） (2025-11-12T15:58:05Z)
Accelerating 3D Photoacoustic Computed Tomography with End-to-End Physics-Aware Neural Operators [74.65171736966131]
光音響計算トモグラフィ(PACT)は、光コントラストと超音波分解能を組み合わせることで、光拡散限界を超える深部像を実現する。現在の実装では、高密度トランスデューサアレイと長い取得時間を必要とし、臨床翻訳を制限している。本研究では,センサ計測からボリューム再構成まで,逆音響マッピングを直接学習する物理認識モデルであるPanoを紹介する。
論文参考訳（メタデータ） (2025-09-11T23:12:55Z)
Harnessing Foundation Models for Robust and Generalizable 6-DOF Bronchoscopy Localization [2.795503750654676]
視覚に基づく6-DOF気管支鏡の局所化は、正確で費用対効果の高い介入誘導のための有望なソリューションを提供する。既存の方法では,1)ラベル付きデータ不足による患者全体の一般化の制限,2)視覚的劣化による堅牢性の低下に苦慮している。気管支鏡の局所化フレームワークであるPANSv2を提案する。
論文参考訳（メタデータ） (2025-05-30T06:14:12Z)
SuperFlow++: Enhanced Spatiotemporal Consistency for Cross-Modal Data Pretraining [62.433137130087445]
SuperFlow++は、連続するカメラペアを使用して事前トレーニングと下流タスクを統合する新しいフレームワークである。 SuperFlow++は様々なタスクや運転条件で最先端のメソッドよりも優れています。強力な一般化性と計算効率により、SuperFlow++は、自動運転におけるデータ効率の高いLiDARベースの認識のための新しいベンチマークを確立する。
論文参考訳（メタデータ） (2025-03-25T17:59:57Z)
REMOTE: Real-time Ego-motion Tracking for Various Endoscopes via Multimodal Visual Feature Learning [0.7499722271664147]
内視鏡のためのリアルタイムエゴモーショントラッキングを実現するための新しいフレームワークを提案する。相対的なポーズ予測を行うために,マルチモーダル視覚特徴学習ネットワークを提案する。内視鏡の絶対的なポーズは相対的なポーズに基づいて計算される。
論文参考訳（メタデータ） (2025-01-30T03:58:41Z)
Self-supervised Monocular Depth and Pose Estimation for Endoscopy with Generative Latent Priors [10.61978045582697]
内視鏡における3Dマッピングは、消化管(GI)内の定量的、全体的病変のキャラクタリゼーションを可能にする。既存の合成データセットや複雑なモデルに依存する手法は、しばしば内視鏡的条件に挑戦する際の一般化性に欠ける。本稿では,多変量オートエンコーダと生成潜在銀行を組み込んだ,頑健な自己監督型単眼深度とポーズ推定フレームワークを提案する。
論文参考訳（メタデータ） (2024-11-26T15:43:06Z)
ALOcc: Adaptive Lifting-based 3D Semantic Occupancy and Cost Volume-based Flow Prediction [89.89610257714006]
既存の手法は、これらのタスクの要求に応えるために高い精度を優先する。本稿では,3次元セマンティック占有率予測とフロー推定のための一連の改善点を紹介する。私たちの純粋な時間的アーキテクチャフレームワークであるALOccは、速度と精度の最適なトレードオフを実現しています。
論文参考訳（メタデータ） (2024-11-12T11:32:56Z)
Inflated 3D Convolution-Transformer for Weakly-supervised Carotid Stenosis Grading with Ultrasound Videos [12.780908780402516]
自動頸動脈狭窄グレーディング(CSG)のための第1のビデオ分類フレームワークについて紹介する。弱教師付きCSGのための新しい効果的な映像分類ネットワークを提案する。本手法は,大容量の頸動脈ビデオデータセットで広く検証されている。
論文参考訳（メタデータ） (2023-06-05T02:50:06Z)
CSDN: Combing Shallow and Deep Networks for Accurate Real-time Segmentation of High-definition Intravascular Ultrasound Images [4.062948258086793]
我々は60MHz高分解能IVUS画像の効率的な分割のための2ストリームフレームワークを提案する。浅いネットワークと深いネットワーク、すなわちCSDNを組み合わせる。上記の情報を別々に扱うことで、モデルを学習し、精度の高いリアルタイムセグメンテーションを実現することができる。
論文参考訳（メタデータ） (2023-01-30T14:42:48Z)
Accurate and Real-time Pseudo Lidar Detection: Is Stereo Neural Network Really Necessary? [6.8067583993953775]
我々は,より強力なステレオマッチング予測器を備えたシステムを開発し,精度向上のための改良手法を提案する。提案システムは23ミリ秒の計算で最先端のアプローチと競合する精度を達成し,実車用アプリケーションへのデプロイに適した候補であることを示す。
論文参考訳（メタデータ） (2022-06-28T09:53:00Z)
Unsupervised inter-frame motion correction for whole-body dynamic PET using convolutional long short-term memory in a convolutional neural network [9.349668170221975]
我々は、フレーム間の身体の動きを補正するための教師なしのディープラーニングベースのフレームワークを開発する。運動推定ネットワークは、畳み込み長短期記憶層を組み合わせた畳み込みニューラルネットワークである。トレーニング後,提案したネットワークの動作推定時間は,従来の登録ベースラインの約460倍の速度であった。
論文参考訳（メタデータ） (2022-06-13T17:38:16Z)
Unsupervised Scale-consistent Depth Learning from Video [131.3074342883371]
本研究では,単眼深度推定器SC-Depthを提案する。スケール一貫性予測の能力により,我々の単分子学習深層ネットワークは簡単にORB-SLAM2システムに統合可能であることを示す。提案したハイブリッドPseudo-RGBD SLAMは、KITTIにおいて魅力的な結果を示し、追加のトレーニングなしでKAISTデータセットにうまく一般化する。
論文参考訳（メタデータ） (2021-05-25T02:17:56Z)
Multi-view Depth Estimation using Epipolar Spatio-Temporal Networks [87.50632573601283]
一つのビデオから多視点深度を推定する新しい手法を提案する。提案手法は,新しいEpipolar Spatio-Temporal Transformer(EST)を用いて時間的コヒーレントな深度推定を行う。最近のMixture-of-Expertsモデルにインスパイアされた計算コストを削減するため、我々はコンパクトなハイブリッドネットワークを設計する。
論文参考訳（メタデータ） (2020-11-26T04:04:21Z)
Enhancing Fiber Orientation Distributions using convolutional Neural Networks [0.0]
商業的に取得したMRIにおけるFODの改善について学ぶ。パッチベースの3次元畳み込みニューラルネットワーク(CNN)の評価本手法により,シングルシェルdMRI取得プロトコル上でのCDDモデル推定が可能となる。
論文参考訳（メタデータ） (2020-08-12T16:06:25Z)
4D Spatio-Temporal Convolutional Networks for Object Position Estimation in OCT Volumes [69.62333053044712]
3次元畳み込みニューラルネットワーク(CNN)は、単一のOCT画像を用いたマーカーオブジェクトのポーズ推定に有望な性能を示した。我々は3次元CNNを4次元時間CNNに拡張し、マーカーオブジェクト追跡のための追加の時間情報の影響を評価する。
論文参考訳（メタデータ） (2020-07-02T12:02:20Z)
AutoHR: A Strong End-to-end Baseline for Remote Heart Rate Measurement with Neural Searching [76.4844593082362]
既存のエンド・ツー・エンドのネットワークが難易度が低い理由を考察し,アーキテクチャ・サーチ(NAS)を用いたリモートHR計測のための強力なベースラインを確立する。総合的な実験は、時間内テストとクロスデータセットテストの両方で3つのベンチマークデータセットで実施される。
論文参考訳（メタデータ） (2020-04-26T05:43:21Z)
Depthwise Non-local Module for Fast Salient Object Detection Using a Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文参考訳（メタデータ） (2020-01-22T15:23:48Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。