Fugu-MT 論文翻訳(概要): Deep Single Image Camera Calibration by Heatmap Regression to Recover Fisheye Images Under ManhattanWorld AssumptionWithout Ambiguity

論文の概要: Deep Single Image Camera Calibration by Heatmap Regression to Recover Fisheye Images Under ManhattanWorld AssumptionWithout Ambiguity

arxiv url: http://arxiv.org/abs/2303.17166v1
Date: Thu, 30 Mar 2023 05:57:59 GMT
ステータス: 翻訳完了
システム内更新日: 2023-03-31 14:15:24.270613
Title: Deep Single Image Camera Calibration by Heatmap Regression to Recover Fisheye Images Under ManhattanWorld AssumptionWithout Ambiguity
Title（参考訳）: マンハッタン世界における魚眼画像復元のための熱マップ回帰による深部単眼カメラの校正
Authors: Nobuhiko Wakai, Satoshi Sato, Yasunori Ishii, Takayoshi Yamashita
Abstract要約: マンハッタンの世界座標では、画像からのパン角の起源は任意であり、パン角の4倍の回転対称な曖昧さである。本稿では,道路の方向と走行方向に基づいて,パングルの起源の定義を提案する。提案手法は,大規模データセットやオフザシェルフカメラにおいて,従来の手法よりも優れている。
参考スコア（独自算出の注目度）: 6.962333053044713
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: In orthogonal world coordinates, a Manhattan world lying along cuboid buildings is widely useful for various computer vision tasks. However, the Manhattan world has much room for improvement because the origin of pan angles from an image is arbitrary, that is, four-fold rotational symmetric ambiguity of pan angles. To address this problem, we propose a definition for the pan-angle origin based on the directions of the roads with respect to a camera and the direction of travel. We propose a learning-based calibration method that uses heatmap regression to remove the ambiguity by each direction of labeled image coordinates, similar to pose estimation keypoints. Simultaneously, our two-branched network recovers the rotation and removes fisheye distortion from a general scene image. To alleviate the lack of vanishing points in images, we introduce auxiliary diagonal points that have the optimal 3D arrangement of spatial uniformity. Extensive experiments demonstrated that our method outperforms conventional methods on large-scale datasets and with off-the-shelf cameras.
Abstract（参考訳）: 直交世界座標では、立方体建物に沿って横たわるマンハッタンの世界は、様々なコンピュータビジョンタスクに広く有用である。しかし、マンハッタンの世界は、画像からのパン角の起源が任意であり、パン角の4倍回転対称な曖昧さのため、多くの改善の余地がある。そこで本研究では,カメラと移動方向に関する道路の方向に基づくパンアングルの起源の定義を提案する。本稿では,ポーズ推定キーポイントのようなラベル付き画像座標の各方向のあいまいさを取り除くために,熱マップ回帰を用いた学習ベースの校正手法を提案する。同時に、2分岐ネットワークは回転を回復し、一般的なシーン画像から魚眼歪みを除去する。画像の消失点の欠如を軽減するため,空間的均一性の最適3次元配置を有する補助的対角点を導入する。大規模な実験により,本手法は大規模データセットや市販カメラの従来の手法よりも優れていた。

関連論文リスト

CylinderDepth: Cylindrical Spatial Attention for Multi-View Consistent Self-Supervised Surround Depth Estimation [0.9558392439655014]
自己教師付きサラウンドビュー深度推定は、複数の最小重畳された画像から360視野の高密度で低コストな3D知覚を可能にする。しかし、既存の手法のほとんどは、重なり合う画像の間に矛盾する深さ推定に悩まされている。本稿では,高密度,メートル法,クロスビューに一貫性のある深度を予測できる,時間同期型マルチカメラリグの幾何誘導手法を提案する。
論文参考訳（メタデータ） (2025-11-20T14:55:28Z)
Extending Foundational Monocular Depth Estimators to Fisheye Cameras with Calibration Tokens [8.197905977697552]
魚眼画像に対する基礎的単眼深度推定器(FMDE)の拡張手法を提案する。本手法は,魚眼画像と視線画像とを符号化した潜伏埋め込みの分布を一致させる。
論文参考訳（メタデータ） (2025-08-06T23:23:20Z)
Revisiting Depth Representations for Feed-Forward 3D Gaussian Splatting [57.43483622778394]
本稿では,事前学習した変圧器によって予測される点マップに基づく新しい正規化損失PM-Lossを紹介する。改良された深度マップにより,様々なアーキテクチャやシーンのフィードフォワード3DGSを大幅に改善する。
論文参考訳（メタデータ） (2025-06-05T17:58:23Z)
PRaDA: Projective Radial Distortion Averaging [40.77624901787694]
本研究では, 放射状に歪んだカメラの自動校正問題に挑戦する。提案手法である射影放射歪平均化法は、完全に射影するフレームワークにおいて、複数の歪み推定を平均化する。
論文参考訳（メタデータ） (2025-04-23T08:22:59Z)
UniK3D: Universal Camera Monocular 3D Estimation [62.06785782635153]
カメラをモデル化可能なモノクル3D推定法として,UniK3Dを提案する。本手法では, 球面3次元表現を導入し, カメラとシーンの形状をよりよく切り離すことができる。 13の多様なデータセットに対する包括的なゼロショット評価は、3D、ディープ、カメラメトリクスにわたるUniK3Dの最先端のパフォーマンスを示している。
論文参考訳（メタデータ） (2025-03-20T17:49:23Z)
FaVoR: Features via Voxel Rendering for Camera Relocalization [23.7893950095252]
カメラ再ローカライズ手法は、高密度画像アライメントから、クエリ画像からの直接カメラポーズ回帰まで様々である。本稿では,世界規模で疎密だが局所的に密集した2次元特徴の3次元表現を活用する新しい手法を提案する。一連のフレーム上でのランドマークの追跡と三角測量により、追跡中に観察された画像パッチ記述子をレンダリングするために最適化されたスパースボクセルマップを構築する。
論文参考訳（メタデータ） (2024-09-11T18:58:16Z)
RoFIR: Robust Fisheye Image Rectification Framework Impervious to Optical Center Deviation [88.54817424560056]
局所歪みの度合いと方向を測定する歪みベクトルマップ(DVM)を提案する。 DVMを学習することで、大域的な歪みパターンに頼ることなく、各ピクセルの局所歪みを独立に識別することができる。事前学習段階では、歪みベクトルマップを予測し、各画素の局所歪み特徴を知覚する。微調整段階では、魚眼画像修正のための画素単位のフローマップを予測する。
論文参考訳（メタデータ） (2024-06-27T06:38:56Z)
Depth-Regularized Optimization for 3D Gaussian Splatting in Few-Shot Images [47.14713579719103]
オーバーフィッティングを緩和するための幾何ガイドとして,密集深度マップを導入する。調整された深度は3Dガウススプラッティングのカラーベース最適化に有効である。提案手法は,NeRF-LLFFデータセット上で,少ない画像数で検証する。
論文参考訳（メタデータ） (2023-11-22T13:53:04Z)
FrozenRecon: Pose-free 3D Scene Reconstruction with Frozen Depth Models [67.96827539201071]
本稿では,3次元シーン再構成のための新しいテスト時間最適化手法を提案する。本手法は5つのゼロショットテストデータセット上で,最先端のクロスデータセット再構築を実現する。
論文参考訳（メタデータ） (2023-08-10T17:55:02Z)
Towards Accurate Reconstruction of 3D Scene Shape from A Single Monocular Image [91.71077190961688]
まず、未知のスケールまで深さを予測し、単一の単眼画像からシフトする2段階のフレームワークを提案する。次に、3Dポイントの雲のデータを利用して、奥行きの変化とカメラの焦点距離を予測し、3Dシーンの形状を復元します。我々は9つの未知のデータセットで深度モデルを検証し、ゼロショット評価で最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2022-08-28T16:20:14Z)
Rethinking Generic Camera Models for Deep Single Image Camera Calibration to Recover Rotation and Fisheye Distortion [8.877834897951578]
本稿では,様々な歪みに対処可能な汎用カメラモデルを提案する。提案手法は,市販の魚眼カメラで撮影した2つの大規模データセットと画像に対して,従来の手法よりも優れていた。
論文参考訳（メタデータ） (2021-11-25T05:58:23Z)
PICCOLO: Point Cloud-Centric Omnidirectional Localization [20.567452635590943]
一方向局所化のための単純かつ効率的なアルゴリズムであるPICCOLOを提案する。私たちのパイプラインは、クエリとして与えられた単一のイメージで、既定の方法で動作します。 PICCOLOは、様々な環境で評価された場合、既存の全方位ローカライゼーションアルゴリズムよりも精度と安定性が優れている。
論文参考訳（メタデータ） (2021-08-14T14:19:37Z)
Learning to Recover 3D Scene Shape from a Single Image [98.20106822614392]
まず,未知のスケールまで深さを予測し,単一の単眼画像からシフトする2段階フレームワークを提案する。そして、3dポイントクラウドエンコーダを使って深度シフトと焦点距離を予測し、リアルな3dシーンの形状を復元します。
論文参考訳（メタデータ） (2020-12-17T02:35:13Z)
Lightweight Multi-View 3D Pose Estimation through Camera-Disentangled Representation [57.11299763566534]
空間校正カメラで撮影した多視点画像から3次元ポーズを復元する手法を提案する。我々は3次元形状を利用して、入力画像をカメラ視点から切り離したポーズの潜在表現に融合する。アーキテクチャは、カメラプロジェクション演算子に学習した表現を条件付け、ビュー当たりの正確な2次元検出を生成する。
論文参考訳（メタデータ） (2020-04-05T12:52:29Z)
Occlusion-Aware Depth Estimation with Adaptive Normal Constraints [85.44842683936471]
カラービデオから多フレーム深度を推定する新しい学習手法を提案する。本手法は深度推定精度において最先端の手法より優れる。
論文参考訳（メタデータ） (2020-04-02T07:10:45Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。