論文の概要: Camera Calibration through Geometric Constraints from Rotation and
Projection Matrices
- arxiv url: http://arxiv.org/abs/2402.08437v2
- Date: Tue, 20 Feb 2024 12:25:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-21 19:14:11.317647
- Title: Camera Calibration through Geometric Constraints from Rotation and
Projection Matrices
- Title(参考訳): 回転および投影行列からの幾何学的制約によるカメラの校正
- Authors: Muhammad Waleed, Abdul Rauf, Murtaza Taj
- Abstract要約: 本稿では,カメラの内在的・外在的パラメータを測定するための制約に基づく新たな損失を提案する。
我々の手法は、ニューラルネットワークの学習能力を利用して、望ましいパラメータを推定するハイブリッドアプローチである。
提案手法は,最新のSOTA(State-of-the-art)ベンチマークと比較して,全パラメータにまたがる改善を示す。
- 参考スコア(独自算出の注目度): 4.100632594106989
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The process of camera calibration involves estimating the intrinsic and
extrinsic parameters, which are essential for accurately performing tasks such
as 3D reconstruction, object tracking and augmented reality. In this work, we
propose a novel constraints-based loss for measuring the intrinsic (focal
length: $(f_x, f_y)$ and principal point: $(p_x, p_y)$) and extrinsic
(baseline: ($b$), disparity: ($d$), translation: $(t_x, t_y, t_z)$, and
rotation specifically pitch: $(\theta_p)$) camera parameters. Our novel
constraints are based on geometric properties inherent in the camera model,
including the anatomy of the projection matrix (vanishing points, image of
world origin, axis planes) and the orthonormality of the rotation matrix. Thus
we proposed a novel Unsupervised Geometric Constraint Loss (UGCL) via a
multitask learning framework. Our methodology is a hybrid approach that employs
the learning power of a neural network to estimate the desired parameters along
with the underlying mathematical properties inherent in the camera projection
matrix. This distinctive approach not only enhances the interpretability of the
model but also facilitates a more informed learning process. Additionally, we
introduce a new CVGL Camera Calibration dataset, featuring over 900
configurations of camera parameters, incorporating 63,600 image pairs that
closely mirror real-world conditions. By training and testing on both synthetic
and real-world datasets, our proposed approach demonstrates improvements across
all parameters when compared to the state-of-the-art (SOTA) benchmarks. The
code and the updated dataset can be found here:
https://github.com/CVLABLUMS/CVGL-Camera-Calibration
- Abstract(参考訳): カメラキャリブレーションのプロセスは、内在パラメータと外在パラメータを推定することを含み、これは3D再構成、物体追跡、拡張現実などのタスクを正確に実行するために不可欠である。
本研究では、内在性(焦点長:$(f_x, f_y)$と主点:$(p_x, p_y)$)と外在性(ベースライン:$b$, disparity:$d$)、翻訳:$(t_x, t_y, t_z)$、回転特異的ピッチ:$(\theta_p)$)を提案する。
新しい制約はカメラモデルに固有の幾何学的性質に基づいており、射影行列の解剖学(バニッシュ点、世界起源の画像、軸面)と回転行列の正規直交性を含んでいる。
そこで我々は,マルチタスク学習フレームワークを用いて,Unsupervised Geometric Constraint Loss (UGCL)を提案する。
提案手法は,ニューラルネットワークの学習能力を用いて,カメラ投影行列に内在する数学的性質とともに,所望のパラメータを推定するハイブリッド手法である。
この独特のアプローチはモデルの解釈性を高めるだけでなく、よりインフォームドな学習プロセスを促進させる。
さらに,カメラパラメータの900以上の構成を特徴とするCVGLカメラキャリブレーションデータセットを導入し,実世界の条件を忠実に反映した63,600枚の画像ペアを組み込んだ。
合成データセットと実世界のデータセットの両方でトレーニングとテストを行うことで、提案手法は、最先端(SOTA)ベンチマークと比較して、すべてのパラメータにまたがる改善を示す。
コードと更新されたデータセットは以下の通りである。
関連論文リスト
- Gravity-aligned Rotation Averaging with Circular Regression [53.81374943525774]
我々は,重力方向をグローバルパイプラインの回転平均位相に統合する原理的アプローチを導入する。
4つの大規模データセットで最先端の精度を実現する。
論文 参考訳(メタデータ) (2024-10-16T17:37:43Z) - Metric3Dv2: A Versatile Monocular Geometric Foundation Model for Zero-shot Metric Depth and Surface Normal Estimation [74.28509379811084]
Metric3D v2は、ゼロショット距離深さと1枚の画像からの表面正規推定のための幾何学的基礎モデルである。
距離深度推定と表面正規度推定の両方の解を提案する。
本手法は, ランダムに収集したインターネット画像上での計測3次元構造の正確な復元を可能にする。
論文 参考訳(メタデータ) (2024-03-22T02:30:46Z) - Metric3D: Towards Zero-shot Metric 3D Prediction from A Single Image [85.91935485902708]
ゼロショット単視距離深度モデルの鍵は、大規模データトレーニングと様々なカメラモデルからの距離あいまいさの解消の組合せにあることを示す。
本稿では,あいまいさ問題に明示的に対処し,既存の単分子モデルにシームレスに接続可能な標準カメラ空間変換モジュールを提案する。
本手法は, ランダムに収集したインターネット画像上での計測3次元構造の正確な復元を可能にする。
論文 参考訳(メタデータ) (2023-07-20T16:14:23Z) - DIME-Net: Neural Network-Based Dynamic Intrinsic Parameter Rectification
for Cameras with Optical Image Stabilization System [16.390775530663618]
本稿では,ポーズ推定や3次元再構成をリアルタイムで行うニューラルネットワークによる新しい手法を提案する。
提案する動的内在性ポーズ推定ネットワークをDIME-Netと名付け,3つのモバイルデバイス上で実装およびテストを行った。
いずれの場合も、DIME-Netはリジェクションエラーを少なくとも6,4$%削減できる。
論文 参考訳(メタデータ) (2023-03-20T17:45:12Z) - Multi-task Learning for Camera Calibration [3.274290296343038]
一対の画像から内在性(主点オフセットと焦点長)と外因性(ベースライン,ピッチ,翻訳)を予測できるユニークな手法を提案する。
カメラモデルニューラルネットワークを用いて3Dポイントを再構成し、再構成の損失を利用してカメラ仕様を得ることにより、この革新的なカメラ投影損失(CPL)法により、所望のパラメータを推定できる。
論文 参考訳(メタデータ) (2022-11-22T17:39:31Z) - Self-Supervised Camera Self-Calibration from Video [34.35533943247917]
汎用カメラモデルの効率的なファミリーを用いてシーケンスごとのキャリブレーションパラメータを回帰する学習アルゴリズムを提案する。
提案手法は,サブピクセル再投射誤差による自己校正を行い,他の学習手法よりも優れる。
論文 参考訳(メタデータ) (2021-12-06T19:42:05Z) - Camera Calibration through Camera Projection Loss [4.36572039512405]
画像対を用いた固有(焦点長と主点オフセット)パラメータの予測手法を提案する。
従来の手法とは違って,マルチタスク学習フレームワークにおいて,カメラモデル方程式をニューラルネットワークとして組み込んだ新しい表現を提案する。
提案手法は,10パラメータ中7パラメータに対して,ディープラーニングと従来手法の両方に対して,優れた性能を実現する。
論文 参考訳(メタデータ) (2021-10-07T14:03:10Z) - Self-Calibrating Neural Radiance Fields [68.64327335620708]
キャリブレーション対象のないシーンの幾何学と正確なカメラパラメータを共同で学習する。
我々のカメラモデルは、ピンホールモデル、第4次ラジアル歪み、および任意の非線形カメラ歪みを学習可能な汎用ノイズモデルで構成されている。
論文 参考訳(メタデータ) (2021-08-31T13:34:28Z) - Uncertainty-Aware Camera Pose Estimation from Points and Lines [101.03675842534415]
Perspective-n-Point-and-Line (Pn$PL) は、2D-3D特徴座標の3Dモデルに関して、高速で正確で堅牢なカメラローカライゼーションを目指している。
論文 参考訳(メタデータ) (2021-07-08T15:19:36Z) - FLEX: Parameter-free Multi-view 3D Human Motion Reconstruction [70.09086274139504]
マルチビューアルゴリズムはカメラパラメータ、特にカメラ間の相対的な位置に強く依存します。
エンドツーエンドのパラメータフリーマルチビューモデルであるFLEXを紹介します。
Human3.6MおよびKTH Multi-view Football IIデータセットの結果を実証する。
論文 参考訳(メタデータ) (2021-05-05T09:08:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。