論文の概要: Towards real-time 6D pose estimation of objects in single-view cone-beam
X-ray
- arxiv url: http://arxiv.org/abs/2211.03211v1
- Date: Sun, 6 Nov 2022 20:06:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 16:20:21.965482
- Title: Towards real-time 6D pose estimation of objects in single-view cone-beam
X-ray
- Title(参考訳): シングルビューコーンビームX線における物体のリアルタイム6次元ポーズ推定に向けて
- Authors: Christiaan G.A. Viviers, Joel de Bruijn, Lena Filatova, Peter H.N. de
With and Fons van der Sommen
- Abstract要約: X線画像の深層学習モデルに基づく6次元オブジェクト推定は、広範囲にわたるCADモデルと訓練目的のデータを用いたカスタムジオメトリを使用することが多い。
最近のRGBベースの手法では、小さなデータセットを使って推定問題を解くことを選択しており、医療データが少ないX線領域ではより魅力的である。
我々は既存のRGBベースのモデル(SingleShot)を改良し、X線画像からマークされた立方体の6次元ポーズを推定する。
- 参考スコア(独自算出の注目度): 6.971105483667455
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Deep learning-based pose estimation algorithms can successfully estimate the
pose of objects in an image, especially in the field of color images. 6D Object
pose estimation based on deep learning models for X-ray images often use custom
architectures that employ extensive CAD models and simulated data for training
purposes. Recent RGB-based methods opt to solve pose estimation problems using
small datasets, making them more attractive for the X-ray domain where medical
data is scarcely available. We refine an existing RGB-based model
(SingleShotPose) to estimate the 6D pose of a marked cube from grayscale X-ray
images by creating a generic solution trained on only real X-ray data and
adjusted for X-ray acquisition geometry. The model regresses 2D control points
and calculates the pose through 2D/3D correspondences using
Perspective-n-Point(PnP), allowing a single trained model to be used across all
supporting cone-beam-based X-ray geometries. Since modern X-ray systems
continuously adjust acquisition parameters during a procedure, it is essential
for such a pose estimation network to consider these parameters in order to be
deployed successfully and find a real use case. With a 5-cm/5-degree accuracy
of 93% and an average 3D rotation error of 2.2 degrees, the results of the
proposed approach are comparable with state-of-the-art alternatives, while
requiring significantly less real training examples and being applicable in
real-time applications.
- Abstract(参考訳): 深層学習に基づくポーズ推定アルゴリズムは、特にカラー画像の分野において、画像内のオブジェクトのポーズをうまく推定することができる。
X線画像の深層学習モデルに基づく6Dオブジェクトのポーズ推定には,CADモデルとシミュレーションデータを用いたカスタムアーキテクチャが使用される。
最近のRGBベースの手法では、小さなデータセットを使ってポーズ推定の問題を解くことを選択しており、医療データが少ないX線領域ではより魅力的である。
本稿では,既存のrgbベースモデル(singleshotpose)を洗練し,実x線データのみに基づいて訓練された汎用解を作成し,x線取得幾何に調整することにより,グレースケールx線画像からマークされた立方体の6dポーズを推定する。
このモデルは2D制御点を回帰し、パースペクティブ-n-Point(PnP)を用いて2D/3D対応を通してポーズを計算する。
現代のx線システムは、手続き中に取得パラメータを継続的に調整するため、このようなポーズ推定ネットワークがこれらのパラメータを考慮し、デプロイに成功し、実際のユースケースを見つけることが不可欠である。
5cm/5度の精度は93%、平均3次元回転誤差は2.2度であり、提案手法の結果は最先端の代替品に匹敵するが、実際の訓練例は大幅に少なく、リアルタイムアプリケーションに適用できる。
関連論文リスト
- Geometry-Aware Attenuation Learning for Sparse-View CBCT Reconstruction [53.93674177236367]
Cone Beam Computed Tomography (CBCT) は臨床画像撮影において重要な役割を担っている。
従来の方法では、高品質な3D CBCT画像の再構成には数百の2次元X線投影が必要である。
これにより、放射線線量を減らすため、スパースビューCBCT再構成への関心が高まっている。
本稿では,この問題を解決するために,新しい幾何対応エンコーダデコーダフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-26T14:38:42Z) - 6D Object Pose Estimation from Approximate 3D Models for Orbital
Robotics [19.64111218032901]
単一画像から物体の6次元ポーズを推定する新しい手法を提案する。
画素毎に3次元モデル座標を回帰する高密度な2次元から3次元対応予測器を用いる。
提案手法は,SPEED+データセット上での最先端性能を実現し,SPEC2021ポストモーテムコンペティションで優勝した。
論文 参考訳(メタデータ) (2023-03-23T13:18:05Z) - Oral-3Dv2: 3D Oral Reconstruction from Panoramic X-Ray Imaging with
Implicit Neural Representation [3.8215162658168524]
Oral-3Dv2は、単一のパノラマX線画像から3Dラジオロジーを再構成する非逆学習モデルである。
本モデルは,2次元座標を3次元空間内のボクセルの密度値にマッピングすることにより,暗黙的に3次元口腔構造を表現することを学習する。
我々の知る限りでは、これは1枚のパノラマX線画像から3Dラジオグラフィ再構成における非逆学習モデルの最初の作品である。
論文 参考訳(メタデータ) (2023-03-21T18:17:27Z) - 3D Neural Embedding Likelihood: Probabilistic Inverse Graphics for
Robust 6D Pose Estimation [50.15926681475939]
逆グラフィックスは2次元画像から3次元シーン構造を推論することを目的としている。
確率モデルを導入し,不確実性を定量化し,6次元ポーズ推定タスクにおけるロバスト性を実現する。
3DNELは、RGBから学んだニューラルネットワークの埋め込みと深度情報を組み合わせることで、RGB-D画像からのsim-to-real 6Dオブジェクトのポーズ推定の堅牢性を向上させる。
論文 参考訳(メタデータ) (2023-02-07T20:48:35Z) - CNN-based real-time 2D-3D deformable registration from a single X-ray
projection [2.1198879079315573]
本稿では, フルオロスコープ画像を用いたリアルタイム2D-3D非剛体登録法を提案する。
術前スキャンから解剖学の変位場と2次元投影からなるデータセットを生成する。
ニューラルネットワークは、未知の3D変位場を単一の投影画像から回復するように訓練される。
論文 参考訳(メタデータ) (2022-12-15T09:57:19Z) - Unseen Object 6D Pose Estimation: A Benchmark and Baselines [62.8809734237213]
本稿では,新しい物体の6次元ポーズ推定をアルゴリズムで行えるようにするための新しいタスクを提案する。
実画像と合成画像の両方でデータセットを収集し、テストセットで最大48個の未確認オブジェクトを収集する。
エンド・ツー・エンドの3D対応ネットワークをトレーニングすることにより、未確認物体と部分ビューRGBD画像との対応点を高精度かつ効率的に見つけることができる。
論文 参考訳(メタデータ) (2022-06-23T16:29:53Z) - Coupled Iterative Refinement for 6D Multi-Object Pose Estimation [64.7198752089041]
既知の3DオブジェクトのセットとRGBまたはRGB-Dの入力画像から、各オブジェクトの6Dポーズを検出して推定する。
我々のアプローチは、ポーズと対応を緊密に結合した方法で反復的に洗練し、アウトレーヤを動的に除去して精度を向上させる。
論文 参考訳(メタデータ) (2022-04-26T18:00:08Z) - NeRF-Pose: A First-Reconstruct-Then-Regress Approach for
Weakly-supervised 6D Object Pose Estimation [44.42449011619408]
トレーニング中に2次元オブジェクトセグメンテーションと既知の相対カメラポーズしか必要としないNeRF-Poseという,弱教師付き再構築型パイプラインを提案する。
予測応答から安定かつ正確なポーズを推定するために、NeRF対応RAN+SACアルゴリズムを用いる。
LineMod-Occlusion 実験の結果,提案手法は6次元ポーズ推定法と比較して最先端の精度を持つことがわかった。
論文 参考訳(メタデータ) (2022-03-09T15:28:02Z) - GDR-Net: Geometry-Guided Direct Regression Network for Monocular 6D
Object Pose Estimation [71.83992173720311]
単一のRGB画像からの6次元ポーズ推定はコンピュータビジョンの基本課題である。
GDR-Net(Geometry-Guided Direct Regression Network)を用いて6Dポーズをエンドツーエンドで学習する。
提案手法は, LM, LM-O, YCB-Vデータセットの最先端手法よりも優れている。
論文 参考訳(メタデータ) (2021-02-24T09:11:31Z) - Deep Learning compatible Differentiable X-ray Projections for Inverse
Rendering [8.926091372824942]
距離マップを生成するために、メッシュ内部の線状構造によって移動される距離を導出して微分可能とする。
骨盤の実際の2次元蛍光画像から3次元モデルを再構成する逆問題(逆問題)を解くことにより,その応用を示す。
論文 参考訳(メタデータ) (2021-02-04T22:06:05Z) - Shape Prior Deformation for Categorical 6D Object Pose and Size
Estimation [62.618227434286]
RGB-D画像から見えないオブジェクトの6Dポーズとサイズを復元する新しい学習手法を提案する。
本研究では,事前学習したカテゴリ形状からの変形を明示的にモデル化することにより,3次元オブジェクトモデルを再構築するディープネットワークを提案する。
論文 参考訳(メタデータ) (2020-07-16T16:45:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。