論文の概要: Robust Single-view Cone-beam X-ray Pose Estimation with Neural Tuned
Tomography (NeTT) and Masked Neural Radiance Fields (mNeRF)
- arxiv url: http://arxiv.org/abs/2308.00214v2
- Date: Fri, 18 Aug 2023 04:00:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-21 22:37:25.169455
- Title: Robust Single-view Cone-beam X-ray Pose Estimation with Neural Tuned
Tomography (NeTT) and Masked Neural Radiance Fields (mNeRF)
- Title(参考訳): neural tuned tomography (nett) と masked neural radiance fields (mnerf) を用いたロバストな単視点コーンビームx線ポーズ推定
- Authors: Chaochao Zhou, Syed Hasib Akhter Faruqui, Abhinav Patel, Ramez N.
Abdalla, Michael C. Hurley, Ali Shaibani, Matthew B. Potts, Babak S. Jahromi,
Leon Cho, Sameer A. Ansari, Donald R. Cantrell
- Abstract要約: X線プロジェクションを用いた放射能物体のポーズ推定法を提案する。
このタスクの実行において最適なビュー合成が果たす重要な役割を実証する。
- 参考スコア(独自算出の注目度): 1.7015963269859458
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many tasks performed in image-guided, mini-invasive, medical procedures can
be cast as pose estimation problems, where an X-ray projection is utilized to
reach a target in 3D space. Expanding on recent advances in the differentiable
rendering of optically reflective materials, we introduce new methods for pose
estimation of radiolucent objects using X-ray projections, and we demonstrate
the critical role of optimal view synthesis in performing this task. We first
develop an algorithm (DiffDRR) that efficiently computes Digitally
Reconstructed Radiographs (DRRs) and leverages automatic differentiation within
TensorFlow. Pose estimation is performed by iterative gradient descent using a
loss function that quantifies the similarity of the DRR synthesized from a
randomly initialized pose and the true fluoroscopic image at the target pose.
We propose two novel methods for high-fidelity view synthesis, Neural Tuned
Tomography (NeTT) and masked Neural Radiance Fields (mNeRF). Both methods rely
on classic Cone-Beam Computerized Tomography (CBCT); NeTT directly optimizes
the CBCT densities, while the non-zero values of mNeRF are constrained by a 3D
mask of the anatomic region segmented from CBCT. We demonstrate that both NeTT
and mNeRF distinctly improve pose estimation within our framework. By defining
a successful pose estimate to be a 3D angle error of less than 3 deg, we find
that NeTT and mNeRF can achieve similar results, both with overall success
rates more than 93%. However, the computational cost of NeTT is significantly
lower than mNeRF in both training and pose estimation. Furthermore, we show
that a NeTT trained for a single subject can generalize to synthesize
high-fidelity DRRs and ensure robust pose estimations for all other subjects.
Therefore, we suggest that NeTT is an attractive option for robust pose
estimation using fluoroscopic projections.
- Abstract(参考訳): 画像誘導・ミニ侵襲的医療手順における多くのタスクは、X線投影を用いて3次元空間のターゲットに到達するポーズ推定問題としてキャストすることができる。
光反射材料の微分可能レンダリングの最近の進歩を踏まえ,X線プロジェクションを用いた放射能オブジェクトのポーズ推定手法を導入し,このタスクにおける最適なビュー合成の重要性を実証する。
まず、Digitally Reconstructed Radiographs(DRR)を効率的に計算し、TensorFlow内の自動微分を利用するアルゴリズム(DiffDRR)を開発する。
ランダム初期化ポーズから合成されたdrrとターゲットポーズでの真のフルオロスコープ画像との類似性を定量化する損失関数を用いて、反復勾配降下によりポーズ推定を行う。
我々は,高忠実度ビュー合成のための2つの新しい手法,NeTT(Neural Tuned Tomography)とマスク型Neural Radiance Fields(mNeRF)を提案する。
NeTTはCBCTの密度を直接最適化し、mNeRFの非ゼロ値はCBCTから区切られた解剖学的領域の3Dマスクによって制限される。
我々は、NeTTとmNeRFの両方が、我々のフレームワーク内でのポーズ推定を著しく改善することを示した。
3dg未満の3次元角度誤差でポーズ推定を成功させることで,NTTとmNeRFはいずれも93%以上の成功率で同様の結果が得られることがわかった。
しかし,NeTTの計算コストはトレーニングとポーズ推定の両方においてmNeRFよりも有意に低い。
さらに,1つの被験者に対してトレーニングしたNeTTは,高忠実度DRRを合成し,他の被験者に対してロバストなポーズ推定を行うことができることを示す。
したがって,NeTTは蛍光投射を用いたロバストポーズ推定の魅力的な選択肢である可能性が示唆された。
関連論文リスト
- Intraoperative 2D/3D Image Registration via Differentiable X-ray Rendering [5.617649111108429]
DiffPoseは、患者固有のシミュレーションと微分可能な物理ベースのレンダリングを利用して、手動でラベル付けされたデータに頼ることなく正確な2D/3D登録を実現する自己教師型アプローチである。
DiffPoseは手術用データセット全体の術速でサブミリ精度を達成し、既存の教師なしの手法を桁違いに改善し、教師付きベースラインよりも優れています。
論文 参考訳(メタデータ) (2023-12-11T13:05:54Z) - X-Ray to CT Rigid Registration Using Scene Coordinate Regression [1.1687067206676627]
本稿では,極端視点に頑健な完全自動登録手法を提案する。
これは、与えられたX線画像の重なり合う座標を回帰する完全な畳み込みニューラルネットワーク(CNN)に基づいている。
提案手法は, 模擬試験データセットの50パーセンタイルにおける平均平均目標登録誤差(mTRE)を3.79mmとし, ペルビス登録のための実フルオロスコープ画像の50パーセンタイルにおける平均目標登録誤差(mTRE)を9.65mmと予測した。
論文 参考訳(メタデータ) (2023-11-25T17:48:46Z) - Leveraging Neural Radiance Fields for Uncertainty-Aware Visual
Localization [56.95046107046027]
我々は,Neural Radiance Fields (NeRF) を用いてシーン座標回帰のためのトレーニングサンプルを生成することを提案する。
レンダリングにおけるNeRFの効率にもかかわらず、レンダリングされたデータの多くはアーティファクトによって汚染されるか、最小限の情報ゲインしか含まない。
論文 参考訳(メタデータ) (2023-10-10T20:11:13Z) - Deep learning network to correct axial and coronal eye motion in 3D OCT
retinal imaging [65.47834983591957]
深層学習に基づくニューラルネットワークを用いて,OCTの軸運動とコロナ運動のアーチファクトを1つのスキャンで補正する。
実験結果から, 提案手法は動作アーチファクトを効果的に補正し, 誤差が他の方法よりも小さいことを示す。
論文 参考訳(メタデータ) (2023-05-27T03:55:19Z) - The role of noise in denoising models for anomaly detection in medical
images [62.0532151156057]
病理脳病変は脳画像に多彩な外観を示す。
正規データのみを用いた教師なし異常検出手法が提案されている。
空間分解能の最適化と雑音の大きさの最適化により,異なるモデル学習体制の性能が向上することを示す。
論文 参考訳(メタデータ) (2023-01-19T21:39:38Z) - Acute ischemic stroke lesion segmentation in non-contrast CT images
using 3D convolutional neural networks [0.0]
非コントラストCT脳画像における急性虚血性脳梗塞の容積分画を目的とした自動アルゴリズムを提案する。
我々のディープラーニングアプローチは、人気のある3D U-Net畳み込みニューラルネットワークアーキテクチャに基づいている。
論文 参考訳(メタデータ) (2023-01-17T10:39:39Z) - Revisiting 3D Context Modeling with Supervised Pre-training for
Universal Lesion Detection in CT Slices [48.85784310158493]
CTスライスにおける普遍的病変検出のための3Dコンテキスト強化2D特徴を効率的に抽出するための修飾擬似3次元特徴ピラミッドネットワーク(MP3D FPN)を提案する。
新たな事前学習手法により,提案したMP3D FPNは,DeepLesionデータセット上での最先端検出性能を実現する。
提案された3Dプリトレーニングウェイトは、他の3D医療画像分析タスクのパフォーマンスを高めるために使用できる。
論文 参考訳(メタデータ) (2020-12-16T07:11:16Z) - Probabilistic 3D surface reconstruction from sparse MRI information [58.14653650521129]
スパース2次元MR画像データとアレータティック不確実性予測から3次元表面再構成を同時に行うための新しい確率論的深層学習手法を提案する。
本手法は,3つの準直交MR画像スライスから,限られたトレーニングセットから大きな表面メッシュを再構成することができる。
論文 参考訳(メタデータ) (2020-10-05T14:18:52Z) - Simultaneous Estimation of X-ray Back-Scatter and Forward-Scatter using
Multi-Task Learning [59.17383024536595]
後方散乱は複雑な介入の際の患者(皮膚)の服用に大きく寄与する。
前方散乱放射線は投影画像のコントラストを低減し、3次元再構成でアーティファクトを導入する。
本稿では,従来の手法と学習に基づく手法を組み合わせて,検出器に到達した前方散乱を同時に推定する手法を提案する。
論文 参考訳(メタデータ) (2020-07-08T10:47:37Z) - 3D Probabilistic Segmentation and Volumetry from 2D projection images [10.32519161805588]
X線撮影は迅速で安価で、最前線のケアアセスメントや術中リアルタイムイメージングに有用である。
プロジェクティブな情報損失に悩まされており、多くの診断バイオマーカーがベースとなっている重要な情報を欠いている。
本稿では,2次元画像モダリティから3次元容積像を再構成する確率的手法について検討する。
論文 参考訳(メタデータ) (2020-06-23T08:00:51Z) - Robust Self-Supervised Learning of Deterministic Errors in Single-Plane
(Monoplanar) and Dual-Plane (Biplanar) X-ray Fluoroscopy [2.7528170226206443]
ビデオフレームレートでX線像を撮影する蛍光画像は、血管外科医や介入放射線技師によるカテーテル挿入を導くのに有利である。
ダイナミックな動きを非侵襲的に可視化することで、複雑な手術を患者に対してより少ない外傷で行うことができる。
本稿では,単平面および二重平面蛍光法に適した頑健な自己校正アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-01-03T01:56:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。