論文の概要: CGA-PoseNet: Camera Pose Regression via a 1D-Up Approach to Conformal
Geometric Algebra
- arxiv url: http://arxiv.org/abs/2302.05211v1
- Date: Fri, 10 Feb 2023 12:27:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-13 15:54:09.267194
- Title: CGA-PoseNet: Camera Pose Regression via a 1D-Up Approach to Conformal
Geometric Algebra
- Title(参考訳): CGA-PoseNet:コンフォーマル幾何代数への1Dアップアプローチによるカメラポス回帰
- Authors: Alberto Pepe, Joan Lasenby
- Abstract要約: CGA-PoseNetは,CGA(Conformal Geometric Algebra)の1D-Upアプローチを用いて,1つの数学的対象であるモータによる回転と変換をカメラポーズの回帰として表現する。
より簡単な問題定式化により,高精度なカメラポーズの回帰を実現できることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We introduce CGA-PoseNet, which uses the 1D-Up approach to Conformal
Geometric Algebra (CGA) to represent rotations and translations with a single
mathematical object, the motor, for camera pose regression. We do so starting
from PoseNet, which successfully predicts camera poses from small datasets of
RGB frames. State-of-the-art methods, however, require expensive tuning to
balance the orientational and translational components of the camera pose.This
is usually done through complex, ad-hoc loss function to be minimized, and in
some cases also requires 3D points as well as images. Our approach has the
advantage of unifying the camera position and orientation through the motor.
Consequently, the network searches for a single object which lives in a
well-behaved 4D space with a Euclidean signature. This means that we can
address the case of image-only datasets and work efficiently with a simple loss
function, namely the mean squared error (MSE) between the predicted and ground
truth motors. We show that it is possible to achieve high accuracy camera pose
regression with a significantly simpler problem formulation. This 1D-Up
approach to CGA can be employed to overcome the dichotomy between translational
and orientational components in camera pose regression in a compact and elegant
way.
- Abstract(参考訳): CGA-PoseNetは,CGA(Conformal Geometric Algebra)の1D-Upアプローチを用いて,1つの数学的対象であるモータの回転と変換をカメラポーズの回帰として表現する。
私たちは、RGBフレームの小さなデータセットからカメラのポーズをうまく予測するPoseNetから始めています。
しかし、最先端の手法では、カメラポーズの向き付けと翻訳のバランスをとるために高価なチューニングが必要であり、通常は複雑なアドホックな損失関数によって最小化され、場合によっては画像だけでなく3dポイントも必要となる。
我々のアプローチは、モーターを通してカメラの位置と方向を統一する利点がある。
その結果、ネットワークはユークリッド符号を持つ4次元空間に居住する1つの物体を探索する。
つまり、画像のみのデータセットの場合に対処することができ、予測と基底の真理モータ間の平均二乗誤差(mse)と呼ばれる単純な損失関数で効率的に動作する。
より簡単な問題定式化により,高精度なカメラポーズの回帰を実現できることを示す。
CGAへのこの1D-Upアプローチは、コンパクトでエレガントな方法でカメラポーズ回帰における翻訳成分と向き成分の二分法を克服するために利用できる。
関連論文リスト
- No Pose, No Problem: Surprisingly Simple 3D Gaussian Splats from Sparse Unposed Images [100.80376573969045]
NoPoSplatは、多視点画像から3Dガウスアンによってパラメータ化された3Dシーンを再構成できるフィードフォワードモデルである。
提案手法は,推定時にリアルタイムな3次元ガウス再構成を実現する。
この研究は、ポーズフリーの一般化可能な3次元再構成において大きな進歩をもたらし、実世界のシナリオに適用可能であることを示す。
論文 参考訳(メタデータ) (2024-10-31T17:58:22Z) - VICAN: Very Efficient Calibration Algorithm for Large Camera Networks [49.17165360280794]
ポースグラフ最適化手法を拡張する新しい手法を提案する。
我々は、カメラを含む二部グラフ、オブジェクトの動的進化、各ステップにおけるカメラオブジェクト間の相対変換について考察する。
我々のフレームワークは従来のPGOソルバとの互換性を維持しているが、その有効性はカスタマイズされた最適化方式の恩恵を受けている。
論文 参考訳(メタデータ) (2024-03-25T17:47:03Z) - iComMa: Inverting 3D Gaussian Splatting for Camera Pose Estimation via Comparing and Matching [14.737266480464156]
コンピュータビジョンにおける6次元カメラのポーズ推定問題に対処するため,iComMaという手法を提案する。
3次元ガウススプラッティング(3DGS)の反転による高精度カメラポーズ推定法を提案する。
論文 参考訳(メタデータ) (2023-12-14T15:31:33Z) - SparsePose: Sparse-View Camera Pose Regression and Refinement [32.74890928398753]
ワイドベースライン画像のスパースセット(10以下)が与えられた正確なカメラポーズを復元するためのスパースポーズを提案する。
この方法は、初期カメラのポーズを復元し、大規模なオブジェクトのデータセットをトレーニングした後、繰り返し洗練することを学ぶ。
また,物体の5-9画像のみを用いて高忠実度3次元再構成のためのパイプラインを実証した。
論文 参考訳(メタデータ) (2022-11-29T05:16:07Z) - BiCo-Net: Regress Globally, Match Locally for Robust 6D Pose Estimation [32.49091033895255]
双方向対応マッピングネットワーク(BiCo-Net)は、典型的なポーズ回帰によって導かれる点雲を生成する。
局所的マッチングと直接ポーズ回帰による冗長なポーズ予測のアンサンブルは、ノイズ観測に対する最終的なポーズ出力をさらに洗練する。
論文 参考訳(メタデータ) (2022-05-07T03:37:33Z) - GPV-Pose: Category-level Object Pose Estimation via Geometry-guided
Point-wise Voting [103.74918834553249]
GPV-Poseはロバストなカテゴリーレベルのポーズ推定のための新しいフレームワークである。
幾何学的洞察を利用して、カテゴリーレベルのポーズ感応的特徴の学習を強化する。
一般的な公開ベンチマークにおいて、最先端の競合相手に優れた結果をもたらす。
論文 参考訳(メタデータ) (2022-03-15T13:58:50Z) - Self-Calibrating Neural Radiance Fields [68.64327335620708]
キャリブレーション対象のないシーンの幾何学と正確なカメラパラメータを共同で学習する。
我々のカメラモデルは、ピンホールモデル、第4次ラジアル歪み、および任意の非線形カメラ歪みを学習可能な汎用ノイズモデルで構成されている。
論文 参考訳(メタデータ) (2021-08-31T13:34:28Z) - Wide-Baseline Relative Camera Pose Estimation with Directional Learning [46.21836501895394]
提案するDirectionNetは,新しいパラメータ化を用いて5次元相対ポーズ空間上の離散分布を推定し,推定問題を抽出できるようにする。
本研究では,Matterport3DとInstituteNetから構築した合成・実ポーズ推定データセットについて検討した。
論文 参考訳(メタデータ) (2021-06-07T04:46:09Z) - CAPTRA: CAtegory-level Pose Tracking for Rigid and Articulated Objects
from Point Clouds [97.63549045541296]
新規なリジッドオブジェクトインスタンスに対する9DoFポーズトラッキングと,関節付きオブジェクトに対するパート毎ポーズトラッキングを処理可能な統一フレームワークを提案する。
本手法は、高速なFPS 12で、カテゴリレベルのリジッドオブジェクトポーズ(NOCS-REAL275)と関節オブジェクトポーズベンチマーク(SAPIEN、BMVC)の最新のパフォーマンスを実現します。
論文 参考訳(メタデータ) (2021-04-08T00:14:58Z) - Self-supervised Geometric Perception [96.89966337518854]
自己教師付き幾何知覚(self-supervised geometric perception)は、基底幾何モデルラベルなしで対応マッチングのための特徴記述子を学ぶためのフレームワークである。
また,SGPは,地上トラスラベルを用いて訓練した教師付きオークルよりも同等か優れる最先端性能を達成できることを示す。
論文 参考訳(メタデータ) (2021-03-04T15:34:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。