論文の概要: PnP-Net: A hybrid Perspective-n-Point Network
- arxiv url: http://arxiv.org/abs/2003.04626v1
- Date: Tue, 10 Mar 2020 10:43:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-24 20:44:43.953846
- Title: PnP-Net: A hybrid Perspective-n-Point Network
- Title(参考訳): PnP-Net: ハイブリッドなパースペクティブnポイントネットワーク
- Authors: Roy Sheffer, Ami Wiesel
- Abstract要約: 本稿では、ディープラーニングとモデルベースアルゴリズムを組み合わせたハイブリッドアプローチを用いて、ロバストなパースペクティブ・n・ポイント問題を考察する。
計算量の少ない合成パラメータと実世界のデータの両方を実証する。
- 参考スコア(独自算出の注目度): 2.66512000865131
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the robust Perspective-n-Point (PnP) problem using a hybrid
approach that combines deep learning with model based algorithms. PnP is the
problem of estimating the pose of a calibrated camera given a set of 3D points
in the world and their corresponding 2D projections in the image. In its more
challenging robust version, some of the correspondences may be mismatched and
must be efficiently discarded. Classical solutions address PnP via iterative
robust non-linear least squares method that exploit the problem's geometry but
are either inaccurate or computationally intensive. In contrast, we propose to
combine a deep learning initial phase followed by a model-based fine tuning
phase. This hybrid approach, denoted by PnP-Net, succeeds in estimating the
unknown pose parameters under correspondence errors and noise, with low and
fixed computational complexity requirements. We demonstrate its advantages on
both synthetic data and real world data.
- Abstract(参考訳): 我々は,ディープラーニングとモデルベースアルゴリズムを組み合わせたハイブリッド手法を用いて,pnp問題を考える。
PnPは、世界の3Dポイントのセットと、画像中の対応する2Dプロジェクションが与えられたキャリブレーションカメラのポーズを推定する問題である。
より困難なロバストなバージョンでは、いくつかの対応がミスマッチし、効率的に破棄されなければならない。
古典的解法は、問題の幾何を利用するが不正確なか計算集約的な反復的頑健な非線形最小二乗法を介してPnPに対処する。
対照的に、深層学習の初期フェーズとモデルに基づく微調整フェーズを組み合わせることを提案する。
pnp-netで表されるこのハイブリッドアプローチは、応答誤差と雑音の下で未知のポーズパラメータを、計算複雑性の低さと固定の要件で推定することに成功している。
合成データと実世界のデータの両方にその利点を示す。
関連論文リスト
- ParaPoint: Learning Global Free-Boundary Surface Parameterization of 3D Point Clouds [52.03819676074455]
ParaPointは、グローバルな自由境界面パラメータ化を実現するための教師なしのニューラルネットワークパイプラインである。
この研究は、グローバルマッピングと自由境界の両方を追求するニューラルポイントクラウドパラメータ化を調査する最初の試みである。
論文 参考訳(メタデータ) (2024-03-15T14:35:05Z) - Learnable human mesh triangulation for 3D human pose and shape
estimation [6.699132260402631]
関節回転と形状推定の精度は, マルチビュー画像からスキン付き多対人線形モデル(SMPL)に基づくヒューマンメッシュ再構成において, 比較的注目されていない。
本稿では,関節回転・形状再構成の曖昧さとネットワーク学習の困難さを解消する2段階の手法を提案する。
提案手法は, 接合部の回転および形状推定において従来よりも有意に優れており, 接合位置推定では競争性能が向上する。
論文 参考訳(メタデータ) (2022-08-24T01:11:57Z) - Visual SLAM with Graph-Cut Optimized Multi-Plane Reconstruction [11.215334675788952]
本稿では,インスタンス平面セグメンテーションネットワークからのキューを用いたポーズ推定とマッピングを改善する意味平面SLAMシステムを提案する。
メインストリームのアプローチはRGB-Dセンサーを使用するが、そのようなシステムを備えた単眼カメラを使うことは、ロバストデータアソシエーションや正確な幾何モデルフィッティングといった課題に直面している。
論文 参考訳(メタデータ) (2021-08-09T18:16:08Z) - Uncertainty-Aware Camera Pose Estimation from Points and Lines [101.03675842534415]
Perspective-n-Point-and-Line (Pn$PL) は、2D-3D特徴座標の3Dモデルに関して、高速で正確で堅牢なカメラローカライゼーションを目指している。
論文 参考訳(メタデータ) (2021-07-08T15:19:36Z) - Deep Magnification-Flexible Upsampling over 3D Point Clouds [103.09504572409449]
本稿では,高密度点雲を生成するためのエンドツーエンド学習ベースのフレームワークを提案する。
まずこの問題を明示的に定式化し、重みと高次近似誤差を判定する。
そこで我々は,高次改良とともに,統一重みとソート重みを適応的に学習する軽量ニューラルネットワークを設計する。
論文 参考訳(メタデータ) (2020-11-25T14:00:18Z) - Human Body Model Fitting by Learned Gradient Descent [48.79414884222403]
画像に3次元の人体形状を適合させる新しいアルゴリズムを提案する。
このアルゴリズムは高速(約120ms収束)で、データセットに頑健であり、公開評価データセットの最先端結果が得られることを示す。
論文 参考訳(メタデータ) (2020-08-19T14:26:47Z) - Solving the Blind Perspective-n-Point Problem End-To-End With Robust
Differentiable Geometric Optimization [44.85008070868851]
Blind Perspective-n-Pointは、シーンに対するカメラの位置を推定する問題である。
本稿では,視覚幾何学的問題を効果的に解くための,最初の完全エンドツーエンドのトレーニング可能なネットワークを提案する。
論文 参考訳(メタデータ) (2020-07-29T06:35:45Z) - Learning 2D-3D Correspondences To Solve The Blind Perspective-n-Point
Problem [98.92148855291363]
本稿では、6-DoFの絶対カメラポーズ2D--3D対応を同時に解決するディープCNNモデルを提案する。
実データとシミュレーションデータの両方でテストした結果,本手法は既存手法よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-03-15T04:17:30Z) - Belief Propagation Reloaded: Learning BP-Layers for Labeling Problems [83.98774574197613]
最も単純な推論手法の1つとして、切り詰められた最大積のBelief伝播を取り上げ、それをディープラーニングモデルの適切なコンポーネントにするために必要となるものを加えます。
このBP-Layerは畳み込みニューラルネットワーク(CNN)の最終ブロックまたは中間ブロックとして使用できる
このモデルは様々な密集予測問題に適用可能であり、パラメータ効率が高く、ステレオ、光フロー、セマンティックセグメンテーションにおける堅牢な解を提供する。
論文 参考訳(メタデータ) (2020-03-13T13:11:35Z) - W-PoseNet: Dense Correspondence Regularized Pixel Pair Pose Regression [34.8793946023412]
本稿では,新しいポーズ推定アルゴリズムW-PoseNetを提案する。
入力データから6Dポーズ、モデル空間内の3D座標に密に回帰する。
YCB-Video と LineMOD のベンチマーク実験の結果,提案した W-PoseNet は一貫して優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2019-12-26T15:51:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。