論文の概要: The Impact of Machine Learning on 2D/3D Registration for Image-guided
Interventions: A Systematic Review and Perspective
- arxiv url: http://arxiv.org/abs/2108.02238v1
- Date: Wed, 4 Aug 2021 18:31:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-07 01:49:17.301171
- Title: The Impact of Machine Learning on 2D/3D Registration for Image-guided
Interventions: A Systematic Review and Perspective
- Title(参考訳): 画像誘導介入における機械学習が2D/3Dレジストレーションに及ぼす影響 : システムレビューと展望
- Authors: Mathias Unberath, Cong Gao, Yicheng Hu, Max Judish, Russell H Taylor,
Mehran Armand, Robert Grupp
- Abstract要約: 画像ベースのナビゲーションは、最小侵襲手術の次のフロンティアとして広く考えられている。
2D/3Dレジストレーションは3次元構造と2次元画像の間の空間的関係を推定する手法である。
イメージング問題に対する機械学習ベースのアプローチの近年の出現は、2D/3D登録における悪名高い課題のいくつかを解決するための約束である。
- 参考スコア(独自算出の注目度): 6.669432838047949
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image-based navigation is widely considered the next frontier of minimally
invasive surgery. It is believed that image-based navigation will increase the
access to reproducible, safe, and high-precision surgery as it may then be
performed at acceptable costs and effort. This is because image-based
techniques avoid the need of specialized equipment and seamlessly integrate
with contemporary workflows. Further, it is expected that image-based
navigation will play a major role in enabling mixed reality environments and
autonomous, robotic workflows. A critical component of image guidance is 2D/3D
registration, a technique to estimate the spatial relationships between 3D
structures, e.g., volumetric imagery or tool models, and 2D images thereof,
such as fluoroscopy or endoscopy. While image-based 2D/3D registration is a
mature technique, its transition from the bench to the bedside has been
restrained by well-known challenges, including brittleness of the optimization
objective, hyperparameter selection, and initialization, difficulties around
inconsistencies or multiple objects, and limited single-view performance. One
reason these challenges persist today is that analytical solutions are likely
inadequate considering the complexity, variability, and high-dimensionality of
generic 2D/3D registration problems. The recent advent of machine
learning-based approaches to imaging problems that, rather than specifying the
desired functional mapping, approximate it using highly expressive parametric
models holds promise for solving some of the notorious challenges in 2D/3D
registration. In this manuscript, we review the impact of machine learning on
2D/3D registration to systematically summarize the recent advances made by
introduction of this novel technology. Grounded in these insights, we then
offer our perspective on the most pressing needs, significant open problems,
and possible next steps.
- Abstract(参考訳): 画像ベースのナビゲーションは、最小侵襲手術の次のフロンティアと考えられている。
画像に基づくナビゲーションは再現性、安全、高精度の手術へのアクセスを増加させ、許容できるコストと労力で行うことができると信じられている。
これは、画像ベースの技術が特別な機器の必要性を回避し、現代のワークフローとシームレスに統合するためである。
さらに、画像ベースのナビゲーションが、複合現実環境と自律的なロボットワークフローを実現する上で大きな役割を果たすことが期待される。
画像誘導の重要な要素は、2D/3D登録であり、ボリューム画像やツールモデルなどの3D構造と、その2D画像(蛍光顕微鏡や内視鏡)の間の空間的関係を推定する技術である。
画像ベース2D/3D登録は成熟した技術であるが、ベンチからベッドサイドへの遷移は、最適化目標の脆さ、ハイパーパラメータの選択と初期化、不整合や複数のオブジェクトの難しさ、単一ビューのパフォーマンスの制限など、よく知られた課題によって抑制されている。
これらの課題が現在続いている理由の1つは、一般的な2D/3D登録問題の複雑さ、可変性、高次元性を考慮すると、解析的解が不十分である可能性が高いことである。
望まれる関数マッピングを指定するのではなく、高度に表現力のあるパラメトリックモデルを用いて近似することで、2D/3D登録における悪名高い課題を解決することができる。
本稿では,機械学習が2d/3d登録に与える影響を概観し,本技術の導入による最近の進歩を体系的に要約する。
これらの洞察に基づいて、私たちは最も差し迫ったニーズ、重大なオープン問題、そして考えられる次のステップについて、私たちの視点を提供します。
関連論文リスト
- Cross-D Conv: Cross-Dimensional Transferable Knowledge Base via Fourier Shifting Operation [3.69758875412828]
クロスD Conv 演算はフーリエ領域における位相シフトを学習することで次元ギャップを橋渡しする。
本手法は2次元と3次元の畳み込み操作間のシームレスな重み移動を可能にする。
論文 参考訳(メタデータ) (2024-11-02T13:03:44Z) - Implicit-Zoo: A Large-Scale Dataset of Neural Implicit Functions for 2D Images and 3D Scenes [65.22070581594426]
Implicit-Zoo"は、この分野の研究と開発を容易にするために、数千のGPUトレーニング日を必要とする大規模なデータセットである。
1)トランスモデルのトークン位置を学習すること、(2)NeRFモデルに関して直接3Dカメラが2D画像のポーズを取ること、である。
これにより、画像分類、セマンティックセグメンテーション、および3次元ポーズ回帰の3つのタスクすべてのパフォーマンスが向上し、研究のための新たな道が開けることになる。
論文 参考訳(メタデータ) (2024-06-25T10:20:44Z) - GEOcc: Geometrically Enhanced 3D Occupancy Network with Implicit-Explicit Depth Fusion and Contextual Self-Supervision [49.839374549646884]
本稿では,視覚のみのサラウンドビュー知覚に適したジオメトリ強化OccupancyネットワークであるGEOccについて述べる。
提案手法は,Occ3D-nuScenesデータセット上で,画像解像度が最小で,画像バックボーンが最大である状態-Of-The-Art性能を実現する。
論文 参考訳(メタデータ) (2024-05-17T07:31:20Z) - Lifting by Image -- Leveraging Image Cues for Accurate 3D Human Pose
Estimation [10.374944534302234]
2次元ポーズからのリフト」法が3Dヒューマンポーズ推定の主流となっている(3DHPE)
画像中のリッチな意味とテクスチャ情報は、より正確な「リフト」手順に寄与する。
本稿では, 一般化問題の原因と画像特徴の有効性について, 新たな知見を与える。
論文 参考訳(メタデータ) (2023-12-25T07:50:58Z) - Multi-Modal Dataset Acquisition for Photometrically Challenging Object [56.30027922063559]
本稿では,3次元視覚タスクにおける現在のデータセットの限界について,精度,サイズ,リアリズム,および光度に挑戦する対象に対する適切な画像モダリティの観点から検討する。
既存の3次元認識と6次元オブジェクトポーズデータセットを強化する新しいアノテーションと取得パイプラインを提案する。
論文 参考訳(メタデータ) (2023-08-21T10:38:32Z) - DiffuPose: Monocular 3D Human Pose Estimation via Denoising Diffusion
Probabilistic Model [25.223801390996435]
本稿では,1つの2次元キーポイント検出から3次元ポーズを再構築することに焦点を当てた。
我々は,市販の2D検出器から多種多様な3Dポーズを効果的にサンプリングするための,拡散に基づく新しいフレームワークを構築した。
我々は,広く採用されているHuman3.6MとHumanEva-Iデータセットについて評価を行った。
論文 参考訳(メタデータ) (2022-12-06T07:22:20Z) - State of the Art in Dense Monocular Non-Rigid 3D Reconstruction [100.9586977875698]
モノクル2D画像から変形可能なシーン(または非剛体)の3D再構成は、コンピュータビジョンとグラフィックスの長年、活発に研究されてきた領域である。
本研究は,モノクラー映像やモノクラービューの集合から,様々な変形可能な物体や複合シーンを高密度に非剛性で再現するための最先端の手法に焦点を当てる。
論文 参考訳(メタデータ) (2022-10-27T17:59:53Z) - RiCS: A 2D Self-Occlusion Map for Harmonizing Volumetric Objects [68.85305626324694]
カメラ空間における光マーチング (RiCS) は、3次元における前景物体の自己閉塞を2次元の自己閉塞マップに表現する新しい手法である。
表現マップは画像の質を高めるだけでなく,時間的コヒーレントな複雑な影効果をモデル化できることを示す。
論文 参考訳(メタデータ) (2022-05-14T05:35:35Z) - Multi-Objective Dual Simplex-Mesh Based Deformable Image Registration
for 3D Medical Images -- Proof of Concept [0.7734726150561088]
本研究は,単純なメッシュに基づく3次元デュアルダイナミックグリッド変換モデルを用いて,多目的3次元変形可能な画像登録のための最初の手法を提案する。
概念実証プロトタイプは, 総合的, 臨床的な3D登録問題に対して有望な結果を示した。
論文 参考訳(メタデータ) (2022-02-22T16:07:29Z) - Weakly-Supervised 3D Human Pose Learning via Multi-view Images in the
Wild [101.70320427145388]
本稿では、3Dアノテーションを必要としない弱教師付きアプローチを提案し、ラベルのないマルチビューデータから3Dポーズを推定する。
提案手法を2つの大規模データセット上で評価する。
論文 参考訳(メタデータ) (2020-03-17T08:47:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。