論文の概要: Multi-task Learning for Camera Calibration
- arxiv url: http://arxiv.org/abs/2211.12432v1
- Date: Tue, 22 Nov 2022 17:39:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-23 18:38:34.734431
- Title: Multi-task Learning for Camera Calibration
- Title(参考訳): カメラキャリブレーションのためのマルチタスク学習
- Authors: Talha Hanif Butt, Murtaza Taj
- Abstract要約: 一対の画像から内在性(主点オフセットと焦点長)と外因性(ベースライン,ピッチ,翻訳)を予測できるユニークな手法を提案する。
カメラモデルニューラルネットワークを用いて3Dポイントを再構成し、再構成の損失を利用してカメラ仕様を得ることにより、この革新的なカメラ投影損失(CPL)法により、所望のパラメータを推定できる。
- 参考スコア(独自算出の注目度): 3.274290296343038
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: For a number of tasks, such as 3D reconstruction, robotic interface,
autonomous driving, etc., camera calibration is essential. In this study, we
present a unique method for predicting intrinsic (principal point offset and
focal length) and extrinsic (baseline, pitch, and translation) properties from
a pair of images. We suggested a novel method where camera model equations are
represented as a neural network in a multi-task learning framework, in contrast
to existing methods, which build a comprehensive solution. By reconstructing
the 3D points using a camera model neural network and then using the loss in
reconstruction to obtain the camera specifications, this innovative camera
projection loss (CPL) method allows us that the desired parameters should be
estimated. As far as we are aware, our approach is the first one that uses an
approach to multi-task learning that includes mathematical formulas in a
framework for learning to estimate camera parameters to predict both the
extrinsic and intrinsic parameters jointly. Additionally, we provided a new
dataset named as CVGL Camera Calibration Dataset [1] which has been collected
using the CARLA Simulator [2]. Actually, we show that our suggested strategy
out performs both conventional methods and methods based on deep learning on 8
out of 10 parameters that were assessed using both real and synthetic data. Our
code and generated dataset are available at
https://github.com/thanif/Camera-Calibration-through-Camera-Projection-Loss.
- Abstract(参考訳): 3D再構成、ロボットインタフェース、自動運転など、多くのタスクにおいて、カメラのキャリブレーションが不可欠である。
本研究では,一対の画像から本質的(主点オフセットと焦点長)と外部的(ベースライン,ピッチ,翻訳)特性を予測するための一意な方法を提案する。
我々は,マルチタスク学習フレームワークにおいて,カメラモデル方程式をニューラルネットワークとして表現する新しい手法を提案する。
カメラモデルニューラルネットワークを用いて3Dポイントを再構成し、再構成の損失を利用してカメラ仕様を得ることにより、この革新的なカメラ投影損失(CPL)法により、所望のパラメータを推定できる。
私たちが認識している限り、我々のアプローチは、カメラパラメータを推定し、外在的パラメータと内在的パラメータの両方を共同で予測するフレームワークに数学的公式を含むマルチタスク学習へのアプローチを使った最初のものである。
さらに, CARLA シミュレータ [2] を用いて収集した CVGL Camera Calibration Dataset [1] という新しいデータセットも提供した。
実際,本提案手法は,実データと合成データの両方を用いて評価した10項目中8項目の深層学習に基づいて,従来の手法と手法の両方を実行する。
私たちのコードと生成されたデータセットはhttps://github.com/thanif/Camera-Calibration-through-Camera-Projection-Lossで公開されています。
関連論文リスト
- No Pose, No Problem: Surprisingly Simple 3D Gaussian Splats from Sparse Unposed Images [100.80376573969045]
NoPoSplatは、多視点画像から3Dガウスアンによってパラメータ化された3Dシーンを再構成できるフィードフォワードモデルである。
提案手法は,推定時にリアルタイムな3次元ガウス再構成を実現する。
この研究は、ポーズフリーの一般化可能な3次元再構成において大きな進歩をもたらし、実世界のシナリオに適用可能であることを示す。
論文 参考訳(メタデータ) (2024-10-31T17:58:22Z) - Camera Calibration through Geometric Constraints from Rotation and
Projection Matrices [4.100632594106989]
本稿では,カメラの内在的・外在的パラメータを測定するための制約に基づく新たな損失を提案する。
我々の手法は、ニューラルネットワークの学習能力を利用して、望ましいパラメータを推定するハイブリッドアプローチである。
提案手法は,最新のSOTA(State-of-the-art)ベンチマークと比較して,全パラメータにまたがる改善を示す。
論文 参考訳(メタデータ) (2024-02-13T13:07:34Z) - Metric3D: Towards Zero-shot Metric 3D Prediction from A Single Image [85.91935485902708]
ゼロショット単視距離深度モデルの鍵は、大規模データトレーニングと様々なカメラモデルからの距離あいまいさの解消の組合せにあることを示す。
本稿では,あいまいさ問題に明示的に対処し,既存の単分子モデルにシームレスに接続可能な標準カメラ空間変換モジュールを提案する。
本手法は, ランダムに収集したインターネット画像上での計測3次元構造の正確な復元を可能にする。
論文 参考訳(メタデータ) (2023-07-20T16:14:23Z) - RelPose: Predicting Probabilistic Relative Rotation for Single Objects
in the Wild [73.1276968007689]
本稿では、任意のオブジェクトの複数の画像からカメラ視点を推定するデータ駆動手法について述べる。
本手法は, 画像の鮮明さから, 最先端のSfM法とSLAM法より優れていることを示す。
論文 参考訳(メタデータ) (2022-08-11T17:59:59Z) - Self-Supervised Camera Self-Calibration from Video [34.35533943247917]
汎用カメラモデルの効率的なファミリーを用いてシーケンスごとのキャリブレーションパラメータを回帰する学習アルゴリズムを提案する。
提案手法は,サブピクセル再投射誤差による自己校正を行い,他の学習手法よりも優れる。
論文 参考訳(メタデータ) (2021-12-06T19:42:05Z) - Rethinking Generic Camera Models for Deep Single Image Camera
Calibration to Recover Rotation and Fisheye Distortion [8.877834897951578]
本稿では,様々な歪みに対処可能な汎用カメラモデルを提案する。
提案手法は,市販の魚眼カメラで撮影した2つの大規模データセットと画像に対して,従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2021-11-25T05:58:23Z) - Learning Eye-in-Hand Camera Calibration from a Single Image [7.262048441360133]
アイ・イン・ハンドカメラのキャリブレーションはロボティクスの基本的かつ長期にわたる問題である。
本稿では,1枚のRGB画像から,この問題をオンラインに解決するための学習的手法について検討する。
論文 参考訳(メタデータ) (2021-11-01T20:17:31Z) - Camera Calibration through Camera Projection Loss [4.36572039512405]
画像対を用いた固有(焦点長と主点オフセット)パラメータの予測手法を提案する。
従来の手法とは違って,マルチタスク学習フレームワークにおいて,カメラモデル方程式をニューラルネットワークとして組み込んだ新しい表現を提案する。
提案手法は,10パラメータ中7パラメータに対して,ディープラーニングと従来手法の両方に対して,優れた性能を実現する。
論文 参考訳(メタデータ) (2021-10-07T14:03:10Z) - Self-Calibrating Neural Radiance Fields [68.64327335620708]
キャリブレーション対象のないシーンの幾何学と正確なカメラパラメータを共同で学習する。
我々のカメラモデルは、ピンホールモデル、第4次ラジアル歪み、および任意の非線形カメラ歪みを学習可能な汎用ノイズモデルで構成されている。
論文 参考訳(メタデータ) (2021-08-31T13:34:28Z) - Infrastructure-based Multi-Camera Calibration using Radial Projections [117.22654577367246]
パターンベースのキャリブレーション技術は、カメラの内在を個別にキャリブレーションするために使用することができる。
Infrastucture-based calibration techniqueはSLAMやStructure-from-Motionで事前に構築した3Dマップを用いて外部情報を推定することができる。
本稿では,インフラストラクチャベースのアプローチを用いて,マルチカメラシステムをスクラッチから完全にキャリブレーションすることを提案する。
論文 参考訳(メタデータ) (2020-07-30T09:21:04Z) - Lightweight Multi-View 3D Pose Estimation through Camera-Disentangled
Representation [57.11299763566534]
空間校正カメラで撮影した多視点画像から3次元ポーズを復元する手法を提案する。
我々は3次元形状を利用して、入力画像をカメラ視点から切り離したポーズの潜在表現に融合する。
アーキテクチャは、カメラプロジェクション演算子に学習した表現を条件付け、ビュー当たりの正確な2次元検出を生成する。
論文 参考訳(メタデータ) (2020-04-05T12:52:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。