論文の概要: Perspective-1-Ellipsoid: Formulation, Analysis and Solutions of the
Camera Pose Estimation Problem from One Ellipse-Ellipsoid Correspondence
- arxiv url: http://arxiv.org/abs/2208.12513v3
- Date: Wed, 14 Jun 2023 12:09:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-17 03:42:17.429752
- Title: Perspective-1-Ellipsoid: Formulation, Analysis and Solutions of the
Camera Pose Estimation Problem from One Ellipse-Ellipsoid Correspondence
- Title(参考訳): perspective-1-ellipsoid:1つの楕円型対応によるカメラポーズ推定問題の定式化、解析、および解法
- Authors: Vincent Gaudilli\`ere, Gilles Simon, Marie-Odile Berger
- Abstract要約: 我々は,エリスポイド固有の理論的枠組みを導入し,ポーズ推定の文脈で有用性を示す。
提案手法により, 位置や方向のみの推定問題に対して, ポーズ推定問題を低減できることを示す。
- 参考スコア(独自算出の注目度): 1.7188280334580193
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In computer vision, camera pose estimation from correspondences between 3D
geometric entities and their projections into the image has been a widely
investigated problem. Although most state-of-the-art methods exploit low-level
primitives such as points or lines, the emergence of very effective CNN-based
object detectors in the recent years has paved the way to the use of
higher-level features carrying semantically meaningful information. Pioneering
works in that direction have shown that modelling 3D objects by ellipsoids and
2D detections by ellipses offers a convenient manner to link 2D and 3D data.
However, the mathematical formalism most often used in the related litterature
does not enable to easily distinguish ellipsoids and ellipses from other
quadrics and conics, leading to a loss of specificity potentially detrimental
in some developments. Moreover, the linearization process of the projection
equation creates an over-representation of the camera parameters, also possibly
causing an efficiency loss. In this paper, we therefore introduce an
ellipsoid-specific theoretical framework and demonstrate its beneficial
properties in the context of pose estimation. More precisely, we first show
that the proposed formalism enables to reduce the pose estimation problem to a
position or orientation-only estimation problem in which the remaining unknowns
can be derived in closed-form. Then, we demonstrate that it can be further
reduced to a 1 Degree-of-Freedom (1DoF) problem and provide the analytical
derivations of the pose as a function of that unique scalar unknown. We
illustrate our theoretical considerations by visual examples and include a
discussion on the practical aspects. Finally, we release this paper along with
the corresponding source code in order to contribute towards more efficient
resolutions of ellipsoid-related pose estimation problems.
- Abstract(参考訳): コンピュータビジョンでは、3次元幾何学的実体と画像への投影との対応からカメラのポーズ推定が広く研究されている。
多くの最先端の手法は、ポイントやラインのような低レベルプリミティブを利用するが、近年の非常に効果的なCNNベースのオブジェクト検出器の出現は、意味論的に意味のある情報を持つ高レベルな特徴の使用への道を開いた。
この方向のパイオニアは、楕円体による3Dオブジェクトのモデリングと楕円体による2D検出が、2Dデータと3Dデータをリンクするのに便利な方法であることを示した。
しかし、関連するlitteratureでよく使われる数学的形式論は、楕円形や楕円形を他の二次や円錐形と容易に区別することはできず、いくつかの発展において潜在的に有害な特異性の喪失に繋がる。
さらに、投射方程式の線形化過程は、カメラパラメータの過剰表現を生成し、効率損失を引き起こす可能性がある。
そこで本稿では,楕円体固有の理論的枠組みを導入し,ポーズ推定の文脈においてその有益性を示す。
より正確には、提案形式は、残りの未知を閉形式で導出できる位置または向きのみの推定問題に、ポーズ推定問題を還元することができることを示す。
次に,1自由度 (1dof) 問題にさらに縮小できることを示し,その一意なスカラーの関数として,ポーズの解析的導出を提供する。
視覚的な例で理論的考察を例示し,実用的側面について考察する。
最後に,エリプソイド関連ポーズ推定問題のより効率的な解決に向けて,対応するソースコードとともに本論文をリリースする。
関連論文リスト
- DVMNet: Computing Relative Pose for Unseen Objects Beyond Hypotheses [59.51874686414509]
現在のアプローチは、多数の離散的なポーズ仮説を持つ連続的なポーズ表現を近似している。
本稿では,DVMNet(Deep Voxel Matching Network)を提案する。
提案手法は,最先端の手法に比べて計算コストの低い新しいオブジェクトに対して,より正確なポーズ推定を行う。
論文 参考訳(メタデータ) (2024-03-20T15:41:32Z) - GS-Pose: Category-Level Object Pose Estimation via Geometric and
Semantic Correspondence [5.500735640045456]
カテゴリーレベルのポーズ推定は、コンピュータビジョンやロボット工学における多くの潜在的な応用において難しい課題である。
本稿では,事前学習した基礎モデルから得られる幾何学的特徴と意味的特徴の両方を活用することを提案する。
これは、セマンティックな特徴がオブジェクトのテクスチャや外観に対して堅牢であるため、以前のメソッドよりもトレーニングするデータを大幅に少なくする。
論文 参考訳(メタデータ) (2023-11-23T02:35:38Z) - GUPNet++: Geometry Uncertainty Propagation Network for Monocular 3D
Object Detection [95.8940731298518]
我々はGUPNet++(Geometry Uncertainty Propagation Network)を提案する。
トレーニング中の幾何射影の不確実性伝播関係をモデル化し、エンドツーエンドのモデル学習の安定性と効率を向上させる。
実験により,提案手法は画像ベースモノクロ3次元検出におけるSOTA性能を得るだけでなく,簡易なフレームワークで有効性を示す。
論文 参考訳(メタデータ) (2023-10-24T08:45:15Z) - Level Set-Based Camera Pose Estimation From Multiple 2D/3D
Ellipse-Ellipsoid Correspondences [2.016317500787292]
2次元物体検出に対する3次元物体の投影を特徴付けるコスト関数の定義は簡単ではないことを示す。
レベルセットのサンプリングに基づいて楕円楕円コストを開発し、部分的な可視オブジェクトを扱うための優れた特性を実証し、その性能を他の一般的なメトリクスと比較する。
論文 参考訳(メタデータ) (2022-07-16T14:09:54Z) - 3D Magic Mirror: Clothing Reconstruction from a Single Image via a
Causal Perspective [96.65476492200648]
本研究は, 自己監督型3D衣料の再構築手法について検討することを目的とする。
1枚の2D画像から人間の衣服の形状やテクスチャを復元する。
論文 参考訳(メタデータ) (2022-04-27T17:46:55Z) - RNNPose: Recurrent 6-DoF Object Pose Refinement with Robust
Correspondence Field Estimation and Pose Optimization [46.144194562841435]
本稿では、オブジェクトポーズ改善のためのリカレントニューラルネットワーク(RNN)に基づくフレームワークを提案する。
この問題は、推定対応フィールドに基づいて非線形最小二乗問題として定式化される。
各イテレーションにおいて、対応フィールド推定とポーズ精錬を代替して行い、正確なオブジェクトポーズを復元する。
論文 参考訳(メタデータ) (2022-03-24T06:24:55Z) - Learning Stereopsis from Geometric Synthesis for 6D Object Pose
Estimation [11.999630902627864]
現在のモノクラーベース6Dオブジェクトポーズ推定法は、一般的にRGBDベースの手法よりも競争力の低い結果が得られる。
本稿では,短いベースライン2ビュー設定による3次元幾何体積に基づくポーズ推定手法を提案する。
実験により,本手法は最先端の単分子法よりも優れ,異なる物体やシーンにおいて堅牢であることが示された。
論文 参考訳(メタデータ) (2021-09-25T02:55:05Z) - Topology-Preserving 3D Image Segmentation Based On Hyperelastic
Regularization [1.52292571922932]
超弾性正規化を用いた新しい3次元トポロジー保存登録に基づくセグメンテーションモデルを提案する。
提案モデルの有効性を示す合成画像と実画像について, 数値実験を行った。
論文 参考訳(メタデータ) (2021-03-31T02:20:46Z) - Calibrated and Partially Calibrated Semi-Generalized Homographies [65.29477277713205]
視点と一般化カメラから半一般化ホモグラフィーを推定するための最初の最小解を提案する。
提案した解法は、多くの合成および実世界の実験で実証されたように安定かつ効率的である。
論文 参考訳(メタデータ) (2021-03-11T08:56:24Z) - Deep Bingham Networks: Dealing with Uncertainty and Ambiguity in Pose
Estimation [74.76155168705975]
Deep Bingham Networks (DBN)は、3Dデータに関するほぼすべての実生活アプリケーションで発生するポーズ関連の不確実性と曖昧性を扱うことができる。
DBNは、(i)異なる分布モードを生成できる多仮説予測ヘッドにより、アートダイレクトポーズ回帰ネットワークの状態を拡張する。
トレーニング中のモードや後方崩壊を回避し,数値安定性を向上させるための新しいトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2020-12-20T19:20:26Z) - Wide-angle Image Rectification: A Survey [86.36118799330802]
広角画像は、基礎となるピンホールカメラモデルに反する歪みを含む。
これらの歪みを補正することを目的とした画像修正は、これらの問題を解決することができる。
本稿では、異なるアプローチで使用されるカメラモデルについて、詳細な説明と議論を行う。
次に,従来の幾何学に基づく画像修正手法と深層学習法の両方について検討する。
論文 参考訳(メタデータ) (2020-10-30T17:28:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。