論文の概要: Camera Calibration through Camera Projection Loss
- arxiv url: http://arxiv.org/abs/2110.03479v1
- Date: Thu, 7 Oct 2021 14:03:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-08 23:24:51.722097
- Title: Camera Calibration through Camera Projection Loss
- Title(参考訳): カメラ投影損失によるカメラ校正
- Authors: Talha Hanif Butt and Murtaza Taj
- Abstract要約: 画像対を用いた固有(焦点長と主点オフセット)パラメータの予測手法を提案する。
従来の手法とは違って,マルチタスク学習フレームワークにおいて,カメラモデル方程式をニューラルネットワークとして組み込んだ新しい表現を提案する。
提案手法は,10パラメータ中7パラメータに対して,ディープラーニングと従来手法の両方に対して,優れた性能を実現する。
- 参考スコア(独自算出の注目度): 4.36572039512405
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Camera calibration is a necessity in various tasks including 3D
reconstruction, hand-eye coordination for a robotic interaction, autonomous
driving, etc. In this work we propose a novel method to predict extrinsic
(baseline, pitch, and translation), intrinsic (focal length and principal point
offset) parameters using an image pair. Unlike existing methods, instead of
designing an end-to-end solution, we proposed a new representation that
incorporates camera model equations as a neural network in multi-task learning
framework. We estimate the desired parameters via novel \emph{camera projection
loss} (CPL) that uses the camera model neural network to reconstruct the 3D
points and uses the reconstruction loss to estimate the camera parameters. To
the best of our knowledge, ours is the first method to jointly estimate both
the intrinsic and extrinsic parameters via a multi-task learning methodology
that combines analytical equations in learning framework for the estimation of
camera parameters. We also proposed a novel dataset using CARLA Simulator.
Empirically, we demonstrate that our proposed approach achieves better
performance with respect to both deep learning-based and traditional methods on
7 out of 10 parameters evaluated using both synthetic and real data. Our code
and generated dataset will be made publicly available to facilitate future
research.
- Abstract(参考訳): カメラキャリブレーションは、3D再構成、ロボットインタラクションのための手目調整、自動運転など、様々なタスクにおいて必要である。
本研究では,画像ペアを用いて,本質的(焦点長,主点オフセット)パラメータ(ベースライン,ピッチ,翻訳)を予測する新しい手法を提案する。
既存の手法とは異なり、エンドツーエンドのソリューションを設計する代わりに、マルチタスク学習フレームワークにおいて、カメラモデルの方程式をニューラルネットワークとして組み込む新しい表現を提案した。
我々は,カメラモデルニューラルネットワークを用いて3dポイントを再構成し,再構成損失を用いてカメラパラメータを推定する新しい \emph{camera projection loss} (cpl) を用いて,所望のパラメータを推定する。
我々の知る限り、カメラパラメータ推定のための学習フレームワークにおける解析方程式を組み合わせたマルチタスク学習手法を用いて、本質的パラメータと外生的パラメータの両方を共同で推定する最初の方法である。
CARLAシミュレータを用いた新しいデータセットも提案した。
実験により,提案手法は,合成データと実データの両方を用いて評価した10パラメータのうち7つのパラメータにおいて,深層学習ベースと従来手法の両方において,よりよい性能を実現することを実証した。
私たちのコードと生成されたデータセットは、将来の研究を促進するために公開されます。
関連論文リスト
- Camera Calibration through Geometric Constraints from Rotation and
Projection Matrices [4.100632594106989]
本稿では,カメラの内在的・外在的パラメータを測定するための制約に基づく新たな損失を提案する。
我々の手法は、ニューラルネットワークの学習能力を利用して、望ましいパラメータを推定するハイブリッドアプローチである。
提案手法は,最新のSOTA(State-of-the-art)ベンチマークと比較して,全パラメータにまたがる改善を示す。
論文 参考訳(メタデータ) (2024-02-13T13:07:34Z) - Learning Robust Multi-Scale Representation for Neural Radiance Fields
from Unposed Images [65.41966114373373]
コンピュータビジョンにおけるニューラルイメージベースのレンダリング問題に対する改善された解決策を提案する。
提案手法は,テスト時に新たな視点からシーンのリアルなイメージを合成することができる。
論文 参考訳(メタデータ) (2023-11-08T08:18:23Z) - MC-NeRF: Multi-Camera Neural Radiance Fields for Multi-Camera Image Acquisition Systems [22.494866649536018]
ニューラル・ラジアンス・フィールド(NeRF)は3次元シーン表現にマルチビュー・イメージを使用し、顕著な性能を示す。
以前のNeRFベースの手法のほとんどは、ユニークなカメラを前提としており、マルチカメラのシナリオをめったに考慮していない。
提案するMC-NeRFは,内在パラメータと外在パラメータの両方を,NeRFと併用して共同最適化する手法である。
論文 参考訳(メタデータ) (2023-09-14T16:40:44Z) - Multi-task Learning for Camera Calibration [3.274290296343038]
一対の画像から内在性(主点オフセットと焦点長)と外因性(ベースライン,ピッチ,翻訳)を予測できるユニークな手法を提案する。
カメラモデルニューラルネットワークを用いて3Dポイントを再構成し、再構成の損失を利用してカメラ仕様を得ることにより、この革新的なカメラ投影損失(CPL)法により、所望のパラメータを推定できる。
論文 参考訳(メタデータ) (2022-11-22T17:39:31Z) - RelPose: Predicting Probabilistic Relative Rotation for Single Objects
in the Wild [73.1276968007689]
本稿では、任意のオブジェクトの複数の画像からカメラ視点を推定するデータ駆動手法について述べる。
本手法は, 画像の鮮明さから, 最先端のSfM法とSLAM法より優れていることを示す。
論文 参考訳(メタデータ) (2022-08-11T17:59:59Z) - Self-Supervised Camera Self-Calibration from Video [34.35533943247917]
汎用カメラモデルの効率的なファミリーを用いてシーケンスごとのキャリブレーションパラメータを回帰する学習アルゴリズムを提案する。
提案手法は,サブピクセル再投射誤差による自己校正を行い,他の学習手法よりも優れる。
論文 参考訳(メタデータ) (2021-12-06T19:42:05Z) - Learning Eye-in-Hand Camera Calibration from a Single Image [7.262048441360133]
アイ・イン・ハンドカメラのキャリブレーションはロボティクスの基本的かつ長期にわたる問題である。
本稿では,1枚のRGB画像から,この問題をオンラインに解決するための学習的手法について検討する。
論文 参考訳(メタデータ) (2021-11-01T20:17:31Z) - FLEX: Parameter-free Multi-view 3D Human Motion Reconstruction [70.09086274139504]
マルチビューアルゴリズムはカメラパラメータ、特にカメラ間の相対的な位置に強く依存します。
エンドツーエンドのパラメータフリーマルチビューモデルであるFLEXを紹介します。
Human3.6MおよびKTH Multi-view Football IIデータセットの結果を実証する。
論文 参考訳(メタデータ) (2021-05-05T09:08:12Z) - Nothing But Geometric Constraints: A Model-Free Method for Articulated
Object Pose Estimation [89.82169646672872]
本稿では,ロボットアームの関節構成を,モデルに先入観を持たずにRGBまたはRGB-D画像のシーケンスから推定する,教師なし視覚ベースシステムを提案する。
我々は,古典幾何学的定式化と深層学習を組み合わせることで,この課題を解決するために,極性多剛体制約を拡張した。
論文 参考訳(メタデータ) (2020-11-30T20:46:48Z) - Infrastructure-based Multi-Camera Calibration using Radial Projections [117.22654577367246]
パターンベースのキャリブレーション技術は、カメラの内在を個別にキャリブレーションするために使用することができる。
Infrastucture-based calibration techniqueはSLAMやStructure-from-Motionで事前に構築した3Dマップを用いて外部情報を推定することができる。
本稿では,インフラストラクチャベースのアプローチを用いて,マルチカメラシステムをスクラッチから完全にキャリブレーションすることを提案する。
論文 参考訳(メタデータ) (2020-07-30T09:21:04Z) - PaMIR: Parametric Model-Conditioned Implicit Representation for
Image-based Human Reconstruction [67.08350202974434]
本研究では,パラメトリックボディモデルと自由形深部暗黙関数を組み合わせたパラメトリックモデル記述型暗黙表現(PaMIR)を提案する。
本手法は, 挑戦的なポーズや衣料品のタイプにおいて, 画像に基づく3次元再構築のための最先端性能を実現する。
論文 参考訳(メタデータ) (2020-07-08T02:26:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。