論文の概要: Deep Single Image Camera Calibration by Heatmap Regression to Recover
Fisheye Images Under ManhattanWorld AssumptionWithout Ambiguity
- arxiv url: http://arxiv.org/abs/2303.17166v1
- Date: Thu, 30 Mar 2023 05:57:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-31 14:15:24.270613
- Title: Deep Single Image Camera Calibration by Heatmap Regression to Recover
Fisheye Images Under ManhattanWorld AssumptionWithout Ambiguity
- Title(参考訳): マンハッタン世界における魚眼画像復元のための熱マップ回帰による深部単眼カメラの校正
- Authors: Nobuhiko Wakai, Satoshi Sato, Yasunori Ishii, Takayoshi Yamashita
- Abstract要約: マンハッタンの世界座標では、画像からのパン角の起源は任意であり、パン角の4倍の回転対称な曖昧さである。
本稿では,道路の方向と走行方向に基づいて,パングルの起源の定義を提案する。
提案手法は,大規模データセットやオフザシェルフカメラにおいて,従来の手法よりも優れている。
- 参考スコア(独自算出の注目度): 6.962333053044713
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In orthogonal world coordinates, a Manhattan world lying along cuboid
buildings is widely useful for various computer vision tasks. However, the
Manhattan world has much room for improvement because the origin of pan angles
from an image is arbitrary, that is, four-fold rotational symmetric ambiguity
of pan angles. To address this problem, we propose a definition for the
pan-angle origin based on the directions of the roads with respect to a camera
and the direction of travel. We propose a learning-based calibration method
that uses heatmap regression to remove the ambiguity by each direction of
labeled image coordinates, similar to pose estimation keypoints.
Simultaneously, our two-branched network recovers the rotation and removes
fisheye distortion from a general scene image. To alleviate the lack of
vanishing points in images, we introduce auxiliary diagonal points that have
the optimal 3D arrangement of spatial uniformity. Extensive experiments
demonstrated that our method outperforms conventional methods on large-scale
datasets and with off-the-shelf cameras.
- Abstract(参考訳): 直交世界座標では、立方体建物に沿って横たわるマンハッタンの世界は、様々なコンピュータビジョンタスクに広く有用である。
しかし、マンハッタンの世界は、画像からのパン角の起源が任意であり、パン角の4倍回転対称な曖昧さのため、多くの改善の余地がある。
そこで本研究では,カメラと移動方向に関する道路の方向に基づくパンアングルの起源の定義を提案する。
本稿では,ポーズ推定キーポイントのようなラベル付き画像座標の各方向のあいまいさを取り除くために,熱マップ回帰を用いた学習ベースの校正手法を提案する。
同時に、2分岐ネットワークは回転を回復し、一般的なシーン画像から魚眼歪みを除去する。
画像の消失点の欠如を軽減するため,空間的均一性の最適3次元配置を有する補助的対角点を導入する。
大規模な実験により,本手法は大規模データセットや市販カメラの従来の手法よりも優れていた。
関連論文リスト
- Scaled 360 layouts: Revisiting non-central panoramas [5.2178708158547025]
非中央パノラマを用いた室内環境の3次元レイアウト復元手法を提案する。
我々は、新しい幾何学的処理において、非中央プロジェクションシステムの特性を利用して、スケールしたレイアウトを復元する。
論文 参考訳(メタデータ) (2024-02-02T14:55:36Z) - DUSt3R: Geometric 3D Vision Made Easy [9.088432378237606]
Dense and Unconstrained Stereo 3D Reconstruction of arbitrary image collections。
本定式化は単眼および両眼の再建症例を円滑に統一することを示す。
私たちの定式化はシーンの3Dモデルと深度情報を直接提供しますが、興味深いことに、シームレスに回復できます。
論文 参考訳(メタデータ) (2023-12-21T18:52:14Z) - Zolly: Zoom Focal Length Correctly for Perspective-Distorted Human Mesh
Reconstruction [66.10717041384625]
Zollyは、視点歪みの画像に焦点を当てた最初の3DHMR法である。
人体の2次元密度ゆらぎスケールを記述した新しいカメラモデルと新しい2次元歪み画像を提案する。
このタスク用に調整された2つの現実世界のデータセットを拡張します。
論文 参考訳(メタデータ) (2023-03-24T04:22:41Z) - PICCOLO: Point Cloud-Centric Omnidirectional Localization [20.567452635590943]
一方向局所化のための単純かつ効率的なアルゴリズムであるPICCOLOを提案する。
私たちのパイプラインは、クエリとして与えられた単一のイメージで、既定の方法で動作します。
PICCOLOは、様々な環境で評価された場合、既存の全方位ローカライゼーションアルゴリズムよりも精度と安定性が優れている。
論文 参考訳(メタデータ) (2021-08-14T14:19:37Z) - Unsupervised Learning of Fine Structure Generation for 3D Point Clouds
by 2D Projection Matching [66.98712589559028]
微細な構造を持つ3次元点雲生成のための教師なしアプローチを提案する。
本手法は2次元シルエット画像から異なる解像度で微細な3次元構造を復元することができる。
論文 参考訳(メタデータ) (2021-08-08T22:15:31Z) - Multi-View Multi-Person 3D Pose Estimation with Plane Sweep Stereo [71.59494156155309]
既存のマルチビュー3Dポーズ推定手法は、複数のカメラビューからグループ2Dポーズ検出に対するクロスビュー対応を明確に確立する。
平面スイープステレオに基づくマルチビュー3Dポーズ推定手法を提案し、クロスビュー融合と3Dポーズ再構築を1ショットで共同で解決します。
論文 参考訳(メタデータ) (2021-04-06T03:49:35Z) - Calibrated and Partially Calibrated Semi-Generalized Homographies [65.29477277713205]
視点と一般化カメラから半一般化ホモグラフィーを推定するための最初の最小解を提案する。
提案した解法は、多くの合成および実世界の実験で実証されたように安定かつ効率的である。
論文 参考訳(メタデータ) (2021-03-11T08:56:24Z) - Lightweight Multi-View 3D Pose Estimation through Camera-Disentangled
Representation [57.11299763566534]
空間校正カメラで撮影した多視点画像から3次元ポーズを復元する手法を提案する。
我々は3次元形状を利用して、入力画像をカメラ視点から切り離したポーズの潜在表現に融合する。
アーキテクチャは、カメラプロジェクション演算子に学習した表現を条件付け、ビュー当たりの正確な2次元検出を生成する。
論文 参考訳(メタデータ) (2020-04-05T12:52:29Z) - Deep 3D Capture: Geometry and Reflectance from Sparse Multi-View Images [59.906948203578544]
本稿では,任意の物体の高品質な形状と複雑な空間変化を持つBRDFを再構成する学習に基づく新しい手法を提案する。
まず、深層多視点ステレオネットワークを用いて、ビューごとの深度マップを推定する。
これらの深度マップは、異なるビューを粗く整列するために使用される。
本稿では,新しい多視点反射率推定ネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-03-27T21:28:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。