論文の概要: Intraoperative 2D/3D Image Registration via Differentiable X-ray
Rendering
- arxiv url: http://arxiv.org/abs/2312.06358v1
- Date: Mon, 11 Dec 2023 13:05:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-12 15:28:40.825839
- Title: Intraoperative 2D/3D Image Registration via Differentiable X-ray
Rendering
- Title(参考訳): 異なるX線レンダリングによる術中2D/3D画像の登録
- Authors: Vivek Gopalakrishnan, Neel Dey, Polina Golland
- Abstract要約: DiffPoseは、患者固有のシミュレーションと微分可能な物理ベースのレンダリングを利用して、手動でラベル付けされたデータに頼ることなく正確な2D/3D登録を実現する自己教師型アプローチである。
DiffPoseは手術用データセット全体の術速でサブミリ精度を達成し、既存の教師なしの手法を桁違いに改善し、教師付きベースラインよりも優れています。
- 参考スコア(独自算出の注目度): 6.136878084725444
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Surgical decisions are informed by aligning rapid portable 2D intraoperative
images (e.g., X-rays) to a high-fidelity 3D preoperative reference scan (e.g.,
CT). 2D/3D image registration often fails in practice: conventional
optimization methods are prohibitively slow and susceptible to local minima,
while neural networks trained on small datasets fail on new patients or require
impractical landmark supervision. We present DiffPose, a self-supervised
approach that leverages patient-specific simulation and differentiable
physics-based rendering to achieve accurate 2D/3D registration without relying
on manually labeled data. Preoperatively, a CNN is trained to regress the pose
of a randomly oriented synthetic X-ray rendered from the preoperative CT. The
CNN then initializes rapid intraoperative test-time optimization that uses the
differentiable X-ray renderer to refine the solution. Our work further proposes
several geometrically principled methods for sampling camera poses from
$\mathbf{SE}(3)$, for sparse differentiable rendering, and for driving
registration in the tangent space $\mathfrak{se}(3)$ with geodesic and
multiscale locality-sensitive losses. DiffPose achieves sub-millimeter accuracy
across surgical datasets at intraoperative speeds, improving upon existing
unsupervised methods by an order of magnitude and even outperforming supervised
baselines. Our code is available at https://github.com/eigenvivek/DiffPose.
- Abstract(参考訳): 外科的決定は、高速携帯型2D術中画像(例えばX線)を高忠実度3D術前基準スキャン(例えばCT)に整列させることで報知される。
2D/3D画像の登録は実際には失敗することが多い: 従来の最適化手法は、局所的なミニマの影響を受けにくい。
DiffPoseは、患者固有のシミュレーションと微分可能な物理ベースのレンダリングを利用して、手動でラベル付けされたデータに頼ることなく正確な2D/3D登録を実現する。
術前に、CNNは、術前CTからレンダリングされたランダムに配向した合成X線のポーズを遅らせるように訓練される。
CNNはその後、X線レンダラーを使ってソリューションを洗練する、迅速な術中テストタイム最適化を初期化する。
本研究は,測地線および多スケールの局所性に敏感な損失を伴う接空間の登録を駆動するために,$\mathbf{se}(3)$ からカメラポーズをサンプリングするための幾何原理的な手法も提案している。
diffposeは術中速度で外科的データセットにまたがるサブミリメートル精度を達成し、既存の教師なしの手法を桁違いに改善し、教師付きベースラインを上回っている。
私たちのコードはhttps://github.com/eigenvivek/diffposeで利用可能です。
関連論文リスト
- Intraoperative Registration by Cross-Modal Inverse Neural Rendering [61.687068931599846]
クロスモーダル逆ニューラルレンダリングによる神経外科手術における術中3D/2Dレジストレーションのための新しいアプローチを提案する。
本手法では,暗黙の神経表現を2つの構成要素に分離し,術前および術中における解剖学的構造について検討した。
臨床症例の振り返りデータを用いて本法の有効性を検証し,現在の登録基準を満たした状態での最先端の検査成績を示した。
論文 参考訳(メタデータ) (2024-09-18T13:40:59Z) - R$^2$-Gaussian: Rectifying Radiative Gaussian Splatting for Tomographic Reconstruction [53.19869886963333]
3次元ガウススプラッティング(3DGS)は画像のレンダリングと表面再構成において有望な結果を示した。
本稿では,Sparse-viewトモグラフィ再構成のための3DGSベースのフレームワークであるR2$-Gaussianを紹介する。
論文 参考訳(メタデータ) (2024-05-31T08:39:02Z) - X-Ray to CT Rigid Registration Using Scene Coordinate Regression [1.1687067206676627]
本稿では,極端視点に頑健な完全自動登録手法を提案する。
これは、与えられたX線画像の重なり合う座標を回帰する完全な畳み込みニューラルネットワーク(CNN)に基づいている。
提案手法は, 模擬試験データセットの50パーセンタイルにおける平均平均目標登録誤差(mTRE)を3.79mmとし, ペルビス登録のための実フルオロスコープ画像の50パーセンタイルにおける平均目標登録誤差(mTRE)を9.65mmと予測した。
論文 参考訳(メタデータ) (2023-11-25T17:48:46Z) - On the Localization of Ultrasound Image Slices within Point Distribution
Models [84.27083443424408]
甲状腺疾患は高分解能超音波(US)で診断されることが多い
縦断追跡は病理甲状腺形態の変化をモニタリングするための重要な診断プロトコルである。
3次元形状表現におけるUS画像の自動スライスローカライズのためのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-01T10:10:46Z) - The Impact of Loss Functions and Scene Representations for 3D/2D
Registration on Single-view Fluoroscopic X-ray Pose Estimation [1.758213853394712]
我々はまずデジタル再構成ラジオグラフィー(DRR)の効率的な計算のための微分可能プロジェクションレンダリングフレームワークを開発する。
次に, 合成したDRRの画像差を, 地表面の蛍光X線画像に対して定量化する, 様々な候補損失関数を用いて, 反復降下によるポーズ推定を行う。
Mutual Information Loss を用いて,50 人の頭蓋骨の断層X線データを用いて行ったポーズ推定を総合的に評価した結果,DiffProj における識別 (CBCT) とニューラル (NeTT/mNeRF) のシーン表現のどちらを用いたかが示唆された。
論文 参考訳(メタデータ) (2023-08-01T01:12:29Z) - Geometry-Aware Attenuation Learning for Sparse-View CBCT Reconstruction [53.93674177236367]
Cone Beam Computed Tomography (CBCT) は臨床画像撮影において重要な役割を担っている。
従来の方法では、高品質な3D CBCT画像の再構成には数百の2次元X線投影が必要である。
これにより、放射線線量を減らすため、スパースビューCBCT再構成への関心が高まっている。
本稿では,この問題を解決するために,新しい幾何対応エンコーダデコーダフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-26T14:38:42Z) - CNN-based real-time 2D-3D deformable registration from a single X-ray
projection [2.1198879079315573]
本稿では, フルオロスコープ画像を用いたリアルタイム2D-3D非剛体登録法を提案する。
術前スキャンから解剖学の変位場と2次元投影からなるデータセットを生成する。
ニューラルネットワークは、未知の3D変位場を単一の投影画像から回復するように訓練される。
論文 参考訳(メタデータ) (2022-12-15T09:57:19Z) - Transfer Learning from an Artificial Radiograph-landmark Dataset for
Registration of the Anatomic Skull Model to Dual Fluoroscopic X-ray Images [0.4205692673448206]
人工データセットからトレーニングしたディープニューラルネットワークを用いた3次元から2次元への3次元登録のための移動学習戦略を提案する。
女性被験者の頭頸部CTデータから,デジタル再構成X線写真(DRR)とX線学的頭蓋骨のランドマークを自動生成した。
ランドマーク検出のための残留ネットワーク(ResNet)と、DRRと実際のX線とのスタイルの違いを取り除くためにGAN(Cycle Generative Adversarial Network)のトレーニングに使用された。
人工的なトレーニングデータを戦略的に増強する手法は、複雑な頭蓋骨登録シナリオに取り組むことができ、広範な登録シナリオにまで拡張する可能性がある。
論文 参考訳(メタデータ) (2021-08-14T04:49:36Z) - Deep Learning compatible Differentiable X-ray Projections for Inverse
Rendering [8.926091372824942]
距離マップを生成するために、メッシュ内部の線状構造によって移動される距離を導出して微分可能とする。
骨盤の実際の2次元蛍光画像から3次元モデルを再構成する逆問題(逆問題)を解くことにより,その応用を示す。
論文 参考訳(メタデータ) (2021-02-04T22:06:05Z) - Revisiting 3D Context Modeling with Supervised Pre-training for
Universal Lesion Detection in CT Slices [48.85784310158493]
CTスライスにおける普遍的病変検出のための3Dコンテキスト強化2D特徴を効率的に抽出するための修飾擬似3次元特徴ピラミッドネットワーク(MP3D FPN)を提案する。
新たな事前学習手法により,提案したMP3D FPNは,DeepLesionデータセット上での最先端検出性能を実現する。
提案された3Dプリトレーニングウェイトは、他の3D医療画像分析タスクのパフォーマンスを高めるために使用できる。
論文 参考訳(メタデータ) (2020-12-16T07:11:16Z) - Neural Descent for Visual 3D Human Pose and Shape [67.01050349629053]
入力RGB画像から3次元のポーズと形状を復元するディープニューラルネットワーク手法を提案する。
我々は最近導入された表現力のあるボディ統計モデルGHUMに頼っている。
我々の方法論の中心は、HUmanNeural Descent (HUND)と呼ばれるアプローチの学習と最適化である。
論文 参考訳(メタデータ) (2020-08-16T13:38:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。