論文の概要: Deep-BrownConrady: Prediction of Camera Calibration and Distortion Parameters Using Deep Learning and Synthetic Data
- arxiv url: http://arxiv.org/abs/2501.14510v1
- Date: Fri, 24 Jan 2025 14:12:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-27 14:57:43.728103
- Title: Deep-BrownConrady: Prediction of Camera Calibration and Distortion Parameters Using Deep Learning and Synthetic Data
- Title(参考訳): Deep-BrownConrady:ディープラーニングと合成データを用いたカメラ校正・歪みパラメータの予測
- Authors: Faiz Muhammad Chaudhry, Jarno Ralli, Jerome Leudet, Fahad Sohrab, Farhad Pakdaman, Pierre Corbani, Moncef Gabbouj,
- Abstract要約: 本研究では,単一画像からのカメラキャリブレーションと歪みパラメータ予測の課題に対処する。
実画像と合成画像の混合に基づいて訓練されたディープラーニングモデルは、単一の画像からカメラとレンズのパラメータを正確に予測することができる。
- 参考スコア(独自算出の注目度): 11.540349678846937
- License:
- Abstract: This research addresses the challenge of camera calibration and distortion parameter prediction from a single image using deep learning models. The main contributions of this work are: (1) demonstrating that a deep learning model, trained on a mix of real and synthetic images, can accurately predict camera and lens parameters from a single image, and (2) developing a comprehensive synthetic dataset using the AILiveSim simulation platform. This dataset includes variations in focal length and lens distortion parameters, providing a robust foundation for model training and testing. The training process predominantly relied on these synthetic images, complemented by a small subset of real images, to explore how well models trained on synthetic data can perform calibration tasks on real-world images. Traditional calibration methods require multiple images of a calibration object from various orientations, which is often not feasible due to the lack of such images in publicly available datasets. A deep learning network based on the ResNet architecture was trained on this synthetic dataset to predict camera calibration parameters following the Brown-Conrady lens model. The ResNet architecture, adapted for regression tasks, is capable of predicting continuous values essential for accurate camera calibration in applications such as autonomous driving, robotics, and augmented reality. Keywords: Camera calibration, distortion, synthetic data, deep learning, residual networks (ResNet), AILiveSim, horizontal field-of-view, principal point, Brown-Conrady Model.
- Abstract(参考訳): 本研究では,深層学習モデルを用いた単一画像からのカメラキャリブレーションと歪みパラメータ予測の課題に対処する。
本研究の主な貢献は,(1)実画像と合成画像の混合に基づいて訓練された深層学習モデルが,単一の画像からカメラおよびレンズパラメータを正確に予測できること,(2)AILiveSimシミュレーションプラットフォームを用いた総合的な合成データセットの開発である。
このデータセットには焦点距離とレンズ歪みパラメータのバリエーションが含まれており、モデルのトレーニングとテストのための堅牢な基盤を提供する。
トレーニングプロセスは主に、合成データに基づいてトレーニングされたモデルが、実際の画像のキャリブレーションタスクをいかにうまく行うかを調べるために、実際の画像の小さなサブセットによって補完されたこれらの合成画像に依存していた。
従来のキャリブレーション法では、様々な方向からキャリブレーション対象の複数のイメージを必要とするが、一般に利用可能なデータセットにそのようなイメージが欠如しているため、しばしば実現不可能である。
この合成データセットに基づいて、ResNetアーキテクチャに基づくディープラーニングネットワークをトレーニングし、Brown-Conradyレンズモデルに従ってカメラキャリブレーションパラメータを予測する。
レグレッションタスクに適応したResNetアーキテクチャは、自律運転、ロボット工学、拡張現実などのアプリケーションにおいて、正確なカメラキャリブレーションに必要な連続的な値を予測できる。
キーワード:カメラの校正、歪み、合成データ、ディープラーニング、残留ネットワーク(ResNet)、AILiveSim、水平視野、主点、ブラウン・コンラディ・モデル。
関連論文リスト
- Neural Lens Modeling [50.57409162437732]
NeuroLens(ニューロレンス)は、点投影と光線鋳造に使用できる歪みと磁化のための神経レンズモデルである。
古典的なキャリブレーションターゲットを使用してプリキャプチャのキャリブレーションを行うことができ、後に3D再構成の際にキャリブレーションやリファインメントを行うために使用できる。
このモデルは、多くのレンズタイプにまたがって一般化されており、既存の3D再構成とレンダリングシステムとの統合は容易である。
論文 参考訳(メタデータ) (2023-04-10T20:09:17Z) - Deep Learning for Camera Calibration and Beyond: A Survey [100.75060862015945]
カメラキャリブレーションでは、キャプチャされたシーケンスから幾何学的特徴を推測するために、カメラパラメータを推定する。
近年の取り組みでは,手動キャリブレーションの繰り返し作業に代えて,学習ベースのソリューションが活用される可能性が示唆されている。
論文 参考訳(メタデータ) (2023-03-19T04:00:05Z) - TexPose: Neural Texture Learning for Self-Supervised 6D Object Pose
Estimation [55.94900327396771]
合成データから6次元オブジェクトポーズ推定のためのニューラルネットワークによるテクスチャ学習を提案する。
実画像からオブジェクトの現実的なテクスチャを予測することを学ぶ。
画素完全合成データからポーズ推定を学習する。
論文 参考訳(メタデータ) (2022-12-25T13:36:32Z) - A Deep Perceptual Measure for Lens and Camera Calibration [35.03926427249506]
従来のマルチイメージキャリブレーション法の代わりに,単一画像から直接カメラキャリブレーションパラメータを推定することを提案する。
大規模なパノラマデータセットから自動的に生成されたサンプルを用いて、このネットワークをトレーニングする。
そこで我々は, カメラキャリブレーションパラメータを補正した3次元物体のリアリズムの判断を参加者に依頼した。
論文 参考訳(メタデータ) (2022-08-25T18:40:45Z) - DeepRM: Deep Recurrent Matching for 6D Pose Refinement [77.34726150561087]
DeepRMは、6Dポーズ改善のための新しいリカレントネットワークアーキテクチャである。
アーキテクチャにはLSTMユニットが組み込まれ、各改善ステップを通じて情報を伝達する。
DeepRMは、2つの広く受け入れられている課題データセットで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-05-28T16:18:08Z) - Creating Realistic Ground Truth Data for the Evaluation of Calibration
Methods for Plenoptic and Conventional Cameras [0.9668407688201357]
カメラキャリブレーション手法の有意義な評価は、現実的な合成データの可用性に依存する。
現実的な地上真実データを生成するために,後方レイトレーシングに基づく手法を提案する。
論文 参考訳(メタデータ) (2022-03-09T11:58:00Z) - Camera Calibration through Camera Projection Loss [4.36572039512405]
画像対を用いた固有(焦点長と主点オフセット)パラメータの予測手法を提案する。
従来の手法とは違って,マルチタスク学習フレームワークにおいて,カメラモデル方程式をニューラルネットワークとして組み込んだ新しい表現を提案する。
提案手法は,10パラメータ中7パラメータに対して,ディープラーニングと従来手法の両方に対して,優れた性能を実現する。
論文 参考訳(メタデータ) (2021-10-07T14:03:10Z) - SIR: Self-supervised Image Rectification via Seeing the Same Scene from
Multiple Different Lenses [82.56853587380168]
本稿では、異なるレンズからの同一シーンの歪み画像の補正結果が同一であるべきという重要な知見に基づいて、新しい自己監督画像補正法を提案する。
我々は、歪みパラメータから修正画像を生成し、再歪み画像を生成するために、微分可能なワープモジュールを利用する。
本手法は,教師付きベースライン法や代表的最先端手法と同等あるいはそれ以上の性能を実現する。
論文 参考訳(メタデータ) (2020-11-30T08:23:25Z) - PennSyn2Real: Training Object Recognition Models without Human Labeling [12.923677573437699]
我々はPennSyn2Realを提案する。20種類以上のマイクロエアロビー(MAV)の10万以上の4K画像からなる合成データセットである。
このデータセットは、MAV検出や分類などのハイレベルコンピュータビジョンタスクのための任意の数のトレーニングイメージを生成するために使用することができる。
このフレームワークを用いて生成された合成データは,検出やセグメンテーションといった一般的なオブジェクト認識タスクに対して,CNNモデルをトレーニングするために直接利用できることを示す。
論文 参考訳(メタデータ) (2020-09-22T02:53:40Z) - Two-shot Spatially-varying BRDF and Shape Estimation [89.29020624201708]
形状とSVBRDFを段階的に推定した新しいディープラーニングアーキテクチャを提案する。
ドメインランダム化された幾何学と現実的な材料を用いた大規模合成学習データセットを作成する。
合成データセットと実世界のデータセットの両方の実験により、合成データセットでトレーニングされたネットワークが、実世界の画像に対してうまく一般化できることが示されている。
論文 参考訳(メタデータ) (2020-04-01T12:56:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。