論文の概要: The Impact of Loss Functions and Scene Representations for 3D/2D
Registration on Single-view Fluoroscopic X-ray Pose Estimation
- arxiv url: http://arxiv.org/abs/2308.00214v3
- Date: Tue, 27 Feb 2024 10:41:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-28 22:39:07.140845
- Title: The Impact of Loss Functions and Scene Representations for 3D/2D
Registration on Single-view Fluoroscopic X-ray Pose Estimation
- Title(参考訳): 3D/2Dレジストレーションにおける損失関数とシーン表現が単一視野蛍光X線量推定に及ぼす影響
- Authors: Chaochao Zhou, Syed Hasib Akhter Faruqui, Abhinav Patel, Ramez N.
Abdalla, Michael C. Hurley, Ali Shaibani, Matthew B. Potts, Babak S. Jahromi,
Sameer A. Ansari, Donald R. Cantrell
- Abstract要約: 我々はまずデジタル再構成ラジオグラフィー(DRR)の効率的な計算のための微分可能プロジェクションレンダリングフレームワークを開発する。
次に, 合成したDRRの画像差を, 地表面の蛍光X線画像に対して定量化する, 様々な候補損失関数を用いて, 反復降下によるポーズ推定を行う。
Mutual Information Loss を用いて,50 人の頭蓋骨の断層X線データを用いて行ったポーズ推定を総合的に評価した結果,DiffProj における識別 (CBCT) とニューラル (NeTT/mNeRF) のシーン表現のどちらを用いたかが示唆された。
- 参考スコア(独自算出の注目度): 1.758213853394712
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many tasks performed in image-guided procedures can be cast as pose
estimation problems, where specific projections are chosen to reach a target in
3D space. In this study, we first develop a differentiable projection
(DiffProj) rendering framework for the efficient computation of Digitally
Reconstructed Radiographs (DRRs) with automatic differentiability from either
Cone-Beam Computerized Tomography (CBCT) or neural scene representations,
including two newly proposed methods, Neural Tuned Tomography (NeTT) and masked
Neural Radiance Fields (mNeRF). We then perform pose estimation by iterative
gradient descent using various candidate loss functions, that quantify the
image discrepancy of the synthesized DRR with respect to the ground-truth
fluoroscopic X-ray image. Compared to alternative loss functions, the Mutual
Information loss function can significantly improve pose estimation accuracy,
as it can effectively prevent entrapment in local optima. Using the Mutual
Information loss, a comprehensive evaluation of pose estimation performed on a
tomographic X-ray dataset of 50 patients$'$ skulls shows that utilizing either
discretized (CBCT) or neural (NeTT/mNeRF) scene representations in DiffProj
leads to comparable performance in DRR appearance and pose estimation (3D angle
errors: mean $\leq$ 3.2{\deg} and 90% quantile $\leq$ 3.4{\deg}), despite the
latter often incurring considerable training expenses and time. These findings
could be instrumental for selecting appropriate approaches to improve the
efficiency and effectiveness of fluoroscopic X-ray pose estimation in
widespread image-guided interventions.
- Abstract(参考訳): 画像誘導プロシージャで実行される多くのタスクは、特定の投影が3次元空間のターゲットに到達するために選択されるポーズ推定問題としてキャストすることができる。
本研究では,新たに提案した2つの手法であるneural tuned tomography (nett) と masked neural radiance fields (mnerf) を含む,コーンビーム型コンピュータ断層撮影 (cbct) またはニューラルネットワークシーン表現と自動微分可能なデジタル再構成ラジオグラフ (drr) の効率的な計算のための微分可能投影 (diffproj) レンダリングフレームワークを開発した。
次に, 様々な候補損失関数を用いた反復勾配降下法によるポーズ推定を行い, 合成したDRRの地上蛍光X線像に対する画像差を定量化する。
代替損失関数と比較して、相互情報損失関数はポーズ推定精度を著しく向上することができ、局所最適の侵入を効果的に防止することができる。
この相互情報損失を用いて、50人の患者の頭蓋骨のトモグラフィx線データセット上でのポーズ推定の総合的な評価により、diffprojにおける離散化(cbct)または神経(nett/mnerf)のシーン表現のどちらかを使用することで、drの出現とポーズ推定のパフォーマンスが同等であることが示されている(3d角度誤差:平均$\leq$ 3.2{\deg} と 90% quantile $\leq$ 3.4{\deg})。
これらの知見は, 広汎な画像誘導介入における蛍光x線像推定の効率と有効性を改善するための適切な方法を選択するのに有用である。
関連論文リスト
- Intraoperative 2D/3D Image Registration via Differentiable X-ray Rendering [5.617649111108429]
DiffPoseは、患者固有のシミュレーションと微分可能な物理ベースのレンダリングを利用して、手動でラベル付けされたデータに頼ることなく正確な2D/3D登録を実現する自己教師型アプローチである。
DiffPoseは手術用データセット全体の術速でサブミリ精度を達成し、既存の教師なしの手法を桁違いに改善し、教師付きベースラインよりも優れています。
論文 参考訳(メタデータ) (2023-12-11T13:05:54Z) - X-Ray to CT Rigid Registration Using Scene Coordinate Regression [1.1687067206676627]
本稿では,極端視点に頑健な完全自動登録手法を提案する。
これは、与えられたX線画像の重なり合う座標を回帰する完全な畳み込みニューラルネットワーク(CNN)に基づいている。
提案手法は, 模擬試験データセットの50パーセンタイルにおける平均平均目標登録誤差(mTRE)を3.79mmとし, ペルビス登録のための実フルオロスコープ画像の50パーセンタイルにおける平均目標登録誤差(mTRE)を9.65mmと予測した。
論文 参考訳(メタデータ) (2023-11-25T17:48:46Z) - Leveraging Neural Radiance Fields for Uncertainty-Aware Visual
Localization [56.95046107046027]
我々は,Neural Radiance Fields (NeRF) を用いてシーン座標回帰のためのトレーニングサンプルを生成することを提案する。
レンダリングにおけるNeRFの効率にもかかわらず、レンダリングされたデータの多くはアーティファクトによって汚染されるか、最小限の情報ゲインしか含まない。
論文 参考訳(メタデータ) (2023-10-10T20:11:13Z) - Deep learning network to correct axial and coronal eye motion in 3D OCT
retinal imaging [65.47834983591957]
深層学習に基づくニューラルネットワークを用いて,OCTの軸運動とコロナ運動のアーチファクトを1つのスキャンで補正する。
実験結果から, 提案手法は動作アーチファクトを効果的に補正し, 誤差が他の方法よりも小さいことを示す。
論文 参考訳(メタデータ) (2023-05-27T03:55:19Z) - The role of noise in denoising models for anomaly detection in medical
images [62.0532151156057]
病理脳病変は脳画像に多彩な外観を示す。
正規データのみを用いた教師なし異常検出手法が提案されている。
空間分解能の最適化と雑音の大きさの最適化により,異なるモデル学習体制の性能が向上することを示す。
論文 参考訳(メタデータ) (2023-01-19T21:39:38Z) - Acute ischemic stroke lesion segmentation in non-contrast CT images
using 3D convolutional neural networks [0.0]
非コントラストCT脳画像における急性虚血性脳梗塞の容積分画を目的とした自動アルゴリズムを提案する。
我々のディープラーニングアプローチは、人気のある3D U-Net畳み込みニューラルネットワークアーキテクチャに基づいている。
論文 参考訳(メタデータ) (2023-01-17T10:39:39Z) - Revisiting 3D Context Modeling with Supervised Pre-training for
Universal Lesion Detection in CT Slices [48.85784310158493]
CTスライスにおける普遍的病変検出のための3Dコンテキスト強化2D特徴を効率的に抽出するための修飾擬似3次元特徴ピラミッドネットワーク(MP3D FPN)を提案する。
新たな事前学習手法により,提案したMP3D FPNは,DeepLesionデータセット上での最先端検出性能を実現する。
提案された3Dプリトレーニングウェイトは、他の3D医療画像分析タスクのパフォーマンスを高めるために使用できる。
論文 参考訳(メタデータ) (2020-12-16T07:11:16Z) - Probabilistic 3D surface reconstruction from sparse MRI information [58.14653650521129]
スパース2次元MR画像データとアレータティック不確実性予測から3次元表面再構成を同時に行うための新しい確率論的深層学習手法を提案する。
本手法は,3つの準直交MR画像スライスから,限られたトレーニングセットから大きな表面メッシュを再構成することができる。
論文 参考訳(メタデータ) (2020-10-05T14:18:52Z) - Simultaneous Estimation of X-ray Back-Scatter and Forward-Scatter using
Multi-Task Learning [59.17383024536595]
後方散乱は複雑な介入の際の患者(皮膚)の服用に大きく寄与する。
前方散乱放射線は投影画像のコントラストを低減し、3次元再構成でアーティファクトを導入する。
本稿では,従来の手法と学習に基づく手法を組み合わせて,検出器に到達した前方散乱を同時に推定する手法を提案する。
論文 参考訳(メタデータ) (2020-07-08T10:47:37Z) - 3D Probabilistic Segmentation and Volumetry from 2D projection images [10.32519161805588]
X線撮影は迅速で安価で、最前線のケアアセスメントや術中リアルタイムイメージングに有用である。
プロジェクティブな情報損失に悩まされており、多くの診断バイオマーカーがベースとなっている重要な情報を欠いている。
本稿では,2次元画像モダリティから3次元容積像を再構成する確率的手法について検討する。
論文 参考訳(メタデータ) (2020-06-23T08:00:51Z) - Robust Self-Supervised Learning of Deterministic Errors in Single-Plane
(Monoplanar) and Dual-Plane (Biplanar) X-ray Fluoroscopy [2.7528170226206443]
ビデオフレームレートでX線像を撮影する蛍光画像は、血管外科医や介入放射線技師によるカテーテル挿入を導くのに有利である。
ダイナミックな動きを非侵襲的に可視化することで、複雑な手術を患者に対してより少ない外傷で行うことができる。
本稿では,単平面および二重平面蛍光法に適した頑健な自己校正アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-01-03T01:56:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。