論文の概要: Deep Single Image Camera Calibration by Heatmap Regression to Recover
Fisheye Images Under ManhattanWorld AssumptionWithout Ambiguity
- arxiv url: http://arxiv.org/abs/2303.17166v1
- Date: Thu, 30 Mar 2023 05:57:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-31 14:15:24.270613
- Title: Deep Single Image Camera Calibration by Heatmap Regression to Recover
Fisheye Images Under ManhattanWorld AssumptionWithout Ambiguity
- Title(参考訳): マンハッタン世界における魚眼画像復元のための熱マップ回帰による深部単眼カメラの校正
- Authors: Nobuhiko Wakai, Satoshi Sato, Yasunori Ishii, Takayoshi Yamashita
- Abstract要約: マンハッタンの世界座標では、画像からのパン角の起源は任意であり、パン角の4倍の回転対称な曖昧さである。
本稿では,道路の方向と走行方向に基づいて,パングルの起源の定義を提案する。
提案手法は,大規模データセットやオフザシェルフカメラにおいて,従来の手法よりも優れている。
- 参考スコア(独自算出の注目度): 6.962333053044713
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In orthogonal world coordinates, a Manhattan world lying along cuboid
buildings is widely useful for various computer vision tasks. However, the
Manhattan world has much room for improvement because the origin of pan angles
from an image is arbitrary, that is, four-fold rotational symmetric ambiguity
of pan angles. To address this problem, we propose a definition for the
pan-angle origin based on the directions of the roads with respect to a camera
and the direction of travel. We propose a learning-based calibration method
that uses heatmap regression to remove the ambiguity by each direction of
labeled image coordinates, similar to pose estimation keypoints.
Simultaneously, our two-branched network recovers the rotation and removes
fisheye distortion from a general scene image. To alleviate the lack of
vanishing points in images, we introduce auxiliary diagonal points that have
the optimal 3D arrangement of spatial uniformity. Extensive experiments
demonstrated that our method outperforms conventional methods on large-scale
datasets and with off-the-shelf cameras.
- Abstract(参考訳): 直交世界座標では、立方体建物に沿って横たわるマンハッタンの世界は、様々なコンピュータビジョンタスクに広く有用である。
しかし、マンハッタンの世界は、画像からのパン角の起源が任意であり、パン角の4倍回転対称な曖昧さのため、多くの改善の余地がある。
そこで本研究では,カメラと移動方向に関する道路の方向に基づくパンアングルの起源の定義を提案する。
本稿では,ポーズ推定キーポイントのようなラベル付き画像座標の各方向のあいまいさを取り除くために,熱マップ回帰を用いた学習ベースの校正手法を提案する。
同時に、2分岐ネットワークは回転を回復し、一般的なシーン画像から魚眼歪みを除去する。
画像の消失点の欠如を軽減するため,空間的均一性の最適3次元配置を有する補助的対角点を導入する。
大規模な実験により,本手法は大規模データセットや市販カメラの従来の手法よりも優れていた。
関連論文リスト
- FaVoR: Features via Voxel Rendering for Camera Relocalization [23.7893950095252]
カメラ再ローカライズ手法は、高密度画像アライメントから、クエリ画像からの直接カメラポーズ回帰まで様々である。
本稿では,世界規模で疎密だが局所的に密集した2次元特徴の3次元表現を活用する新しい手法を提案する。
一連のフレーム上でのランドマークの追跡と三角測量により、追跡中に観察された画像パッチ記述子をレンダリングするために最適化されたスパースボクセルマップを構築する。
論文 参考訳(メタデータ) (2024-09-11T18:58:16Z) - RoFIR: Robust Fisheye Image Rectification Framework Impervious to Optical Center Deviation [88.54817424560056]
局所歪みの度合いと方向を測定する歪みベクトルマップ(DVM)を提案する。
DVMを学習することで、大域的な歪みパターンに頼ることなく、各ピクセルの局所歪みを独立に識別することができる。
事前学習段階では、歪みベクトルマップを予測し、各画素の局所歪み特徴を知覚する。
微調整段階では、魚眼画像修正のための画素単位のフローマップを予測する。
論文 参考訳(メタデータ) (2024-06-27T06:38:56Z) - Depth-Regularized Optimization for 3D Gaussian Splatting in Few-Shot
Images [47.14713579719103]
オーバーフィッティングを緩和するための幾何ガイドとして,密集深度マップを導入する。
調整された深度は3Dガウススプラッティングのカラーベース最適化に有効である。
提案手法は,NeRF-LLFFデータセット上で,少ない画像数で検証する。
論文 参考訳(メタデータ) (2023-11-22T13:53:04Z) - FrozenRecon: Pose-free 3D Scene Reconstruction with Frozen Depth Models [67.96827539201071]
本稿では,3次元シーン再構成のための新しいテスト時間最適化手法を提案する。
本手法は5つのゼロショットテストデータセット上で,最先端のクロスデータセット再構築を実現する。
論文 参考訳(メタデータ) (2023-08-10T17:55:02Z) - Towards Accurate Reconstruction of 3D Scene Shape from A Single
Monocular Image [91.71077190961688]
まず、未知のスケールまで深さを予測し、単一の単眼画像からシフトする2段階のフレームワークを提案する。
次に、3Dポイントの雲のデータを利用して、奥行きの変化とカメラの焦点距離を予測し、3Dシーンの形状を復元します。
我々は9つの未知のデータセットで深度モデルを検証し、ゼロショット評価で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-08-28T16:20:14Z) - Rethinking Generic Camera Models for Deep Single Image Camera
Calibration to Recover Rotation and Fisheye Distortion [8.877834897951578]
本稿では,様々な歪みに対処可能な汎用カメラモデルを提案する。
提案手法は,市販の魚眼カメラで撮影した2つの大規模データセットと画像に対して,従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2021-11-25T05:58:23Z) - PICCOLO: Point Cloud-Centric Omnidirectional Localization [20.567452635590943]
一方向局所化のための単純かつ効率的なアルゴリズムであるPICCOLOを提案する。
私たちのパイプラインは、クエリとして与えられた単一のイメージで、既定の方法で動作します。
PICCOLOは、様々な環境で評価された場合、既存の全方位ローカライゼーションアルゴリズムよりも精度と安定性が優れている。
論文 参考訳(メタデータ) (2021-08-14T14:19:37Z) - Learning to Recover 3D Scene Shape from a Single Image [98.20106822614392]
まず,未知のスケールまで深さを予測し,単一の単眼画像からシフトする2段階フレームワークを提案する。
そして、3dポイントクラウドエンコーダを使って深度シフトと焦点距離を予測し、リアルな3dシーンの形状を復元します。
論文 参考訳(メタデータ) (2020-12-17T02:35:13Z) - Lightweight Multi-View 3D Pose Estimation through Camera-Disentangled
Representation [57.11299763566534]
空間校正カメラで撮影した多視点画像から3次元ポーズを復元する手法を提案する。
我々は3次元形状を利用して、入力画像をカメラ視点から切り離したポーズの潜在表現に融合する。
アーキテクチャは、カメラプロジェクション演算子に学習した表現を条件付け、ビュー当たりの正確な2次元検出を生成する。
論文 参考訳(メタデータ) (2020-04-05T12:52:29Z) - Occlusion-Aware Depth Estimation with Adaptive Normal Constraints [85.44842683936471]
カラービデオから多フレーム深度を推定する新しい学習手法を提案する。
本手法は深度推定精度において最先端の手法より優れる。
論文 参考訳(メタデータ) (2020-04-02T07:10:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。