Fugu-MT 論文翻訳(概要): ImPosIng: Implicit Pose Encoding for Efficient Camera Pose Estimation

論文の概要: ImPosIng: Implicit Pose Encoding for Efficient Camera Pose Estimation

arxiv url: http://arxiv.org/abs/2205.02638v1
Date: Thu, 5 May 2022 13:33:25 GMT
ステータス: 翻訳完了
システム内更新日: 2022-05-06 15:37:29.263201
Title: ImPosIng: Implicit Pose Encoding for Efficient Camera Pose Estimation
Title（参考訳）: 効率的なカメラポーズ推定のための暗黙的ポーズ符号化
Authors: Arthur Moreau, Thomas Gilles, Nathan Piasco, Dzmitry Tsishkou, Bogdan Stanciulescu, Arnaud de La Fortelle
Abstract要約: 暗黙の詩。 (ImPosing)はイメージとカメラのポーズを2つの別々のニューラルネットワークで共通の潜在表現に埋め込む。階層的な方法で潜在空間を通して候補を評価することにより、カメラの位置と向きを直接回帰するのではなく、洗練する。
参考スコア（独自算出の注目度）: 2.6808541153140077
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: We propose a novel learning-based formulation for camera pose estimation that can perform relocalization accurately and in real-time in city-scale environments. Camera pose estimation algorithms determine the position and orientation from which an image has been captured, using a set of geo-referenced images or 3D scene representation. Our new localization paradigm, named Implicit Pose Encoding (ImPosing), embeds images and camera poses into a common latent representation with 2 separate neural networks, such that we can compute a similarity score for each image-pose pair. By evaluating candidates through the latent space in a hierarchical manner, the camera position and orientation are not directly regressed but incrementally refined. Compared to the representation used in structure-based relocalization methods, our implicit map is memory bounded and can be properly explored to improve localization performances against learning-based regression approaches. In this paper, we describe how to effectively optimize our learned modules, how to combine them to achieve real-time localization, and demonstrate results on diverse large scale scenarios that significantly outperform prior work in accuracy and computational efficiency.
Abstract（参考訳）: 本研究では,都市環境下でのリアルタイムかつ正確な位置推定が可能なカメラポーズ推定のための新しい学習型定式化を提案する。カメラポーズ推定アルゴリズムは、ジオリファレンス画像のセットまたは3Dシーン表現を用いて、画像がキャプチャされた位置と向きを決定する。新たなローカライゼーションパラダイムであるImplicit Pose Encoding(ImPosing)は、イメージとカメラのポーズを2つの別々のニューラルネットワークで共通潜伏表現に埋め込むことで、各画像配置ペアの類似度スコアを計算することができる。潜在空間を階層的に評価することにより、カメラの位置と向きは直接後退するのではなく、段階的に洗練される。構造に基づく再ローカライズ手法で用いられる表現と比較して、暗黙マップはメモリ境界であり、学習に基づく回帰アプローチに対するローカライズ性能を改善するために適切に検討することができる。本稿では,学習モジュールを効果的に最適化する方法と,それらを組み合わせてリアルタイムなローカライゼーションを実現する方法について述べる。

関連論文リスト

A Guide to Structureless Visual Localization [63.41481414949785]
既知のシーンにおけるクエリ画像のカメラポーズを推定する方法は、自動運転車や拡張現実/複合現実システムなど、多くのアプリケーションの中核的なコンポーネントである。最先端のビジュアルローカライゼーションアルゴリズムは、シーンの3Dモデルを格納し、カメラポーズ推定モデルにおけるクエリ画像と3Dポイント間の2D-3D対応を利用する。本論文は、私たちの知る限り、初めて包括的な議論を行い、構造化されていない手法の比較を行うものである。
論文参考訳（メタデータ） (2025-04-24T15:08:36Z)
Multiview Image-Based Localization [2.594420805049218]
本稿では、IR方式のように、画像の特徴のみをデータベースに格納するハイブリッド手法を示す。 3Dの手法のように、潜伏した3Dの再構築に頼っているが、3Dのシーンの再構築は維持していない。提案手法では,7ScenesとCambridge Landmarksのデータセットのパフォーマンス向上に加えて,最先端技術と比較して,タイミングとメモリフットプリントの向上が図られている。
論文参考訳（メタデータ） (2025-03-30T20:00:31Z)
Reloc3r: Large-Scale Training of Relative Camera Pose Regression for Generalizable, Fast, and Accurate Visual Localization [25.772574727405825]
視覚的ローカライゼーションは、ポーズ画像のデータベースに対して、クエリ画像のカメラのポーズを決定することを目的としている。カメラのポーズを直接回帰するディープニューラルネットワークは、高速な推論能力のために人気を集めている。 Reloc3rは、シンプルだが効果的な視覚的ローカライゼーションフレームワークである。
論文参考訳（メタデータ） (2024-12-11T13:36:18Z)
No Pose, No Problem: Surprisingly Simple 3D Gaussian Splats from Sparse Unposed Images [100.80376573969045]
NoPoSplatは、多視点画像から3Dガウスアンによってパラメータ化された3Dシーンを再構成できるフィードフォワードモデルである。提案手法は,推定時にリアルタイムな3次元ガウス再構成を実現する。この研究は、ポーズフリーの一般化可能な3次元再構成において大きな進歩をもたらし、実世界のシナリオに適用可能であることを示す。
論文参考訳（メタデータ） (2024-10-31T17:58:22Z)
FaVoR: Features via Voxel Rendering for Camera Relocalization [23.7893950095252]
カメラ再ローカライズ手法は、高密度画像アライメントから、クエリ画像からの直接カメラポーズ回帰まで様々である。本稿では,世界規模で疎密だが局所的に密集した2次元特徴の3次元表現を活用する新しい手法を提案する。一連のフレーム上でのランドマークの追跡と三角測量により、追跡中に観察された画像パッチ記述子をレンダリングするために最適化されたスパースボクセルマップを構築する。
論文参考訳（メタデータ） (2024-09-11T18:58:16Z)
SRPose: Two-view Relative Pose Estimation with Sparse Keypoints [51.49105161103385]
SRPoseは、カメラ・トゥ・ワールドおよびオブジェクト・トゥ・カメラシナリオにおける2ビュー相対ポーズ推定のためのスパースキーポイントベースのフレームワークである。精度と速度の点で最先端の手法と比較して、競争力や優れた性能を達成する。さまざまな画像サイズやカメラ固有の機能に対して堅牢であり、低コンピューティングリソースでデプロイすることができる。
論文参考訳（メタデータ） (2024-07-11T05:46:35Z)
Cameras as Rays: Pose Estimation via Ray Diffusion [54.098613859015856]
カメラのポーズを推定することは3D再構成の基本的な課題であり、まばらにサンプリングされたビューを考えると依然として困難である。本稿では,カメラを光束として扱うカメラポーズの分散表現を提案する。提案手法は回帰法と拡散法の両方で,CO3Dのカメラポーズ推定における最先端性能を示す。
論文参考訳（メタデータ） (2024-02-22T18:59:56Z)
RelPose: Predicting Probabilistic Relative Rotation for Single Objects in the Wild [73.1276968007689]
本稿では、任意のオブジェクトの複数の画像からカメラ視点を推定するデータ駆動手法について述べる。本手法は, 画像の鮮明さから, 最先端のSfM法とSLAM法より優れていることを示す。
論文参考訳（メタデータ） (2022-08-11T17:59:59Z)
On the Limits of Pseudo Ground Truth in Visual Camera Re-localisation [83.29404673257328]
再ローカライゼーションベンチマークは、各メソッドが参照アルゴリズムの結果をいかにうまく再現するかを測定する。このことは、参照アルゴリズムの選択がある種の再ローカライゼーション手法を好むかどうかを問うものである。本稿では、広く使われている2つの再ローカライゼーションデータセットを分析し、参照アルゴリズムの選択によって評価結果が実際に異なることを示す。
論文参考訳（メタデータ） (2021-09-01T12:01:08Z)
Visual Camera Re-Localization Using Graph Neural Networks and Relative Pose Supervision [31.947525258453584]
視覚再局在化とは、単一の画像を入力として、予め記録された環境に対してカメラの位置と向きを推定する手段である。提案手法は特別な仮定をほとんど行わず,訓練やテストでは極めて軽量である。標準の屋内(7-Scenes)と屋外(Cambridge Landmarks)のカメラ再ローカリゼーションベンチマークに対するアプローチの有効性を検証する。
論文参考訳（メタデータ） (2021-04-06T14:29:03Z)
End-to-end learning of keypoint detection and matching for relative pose estimation [1.8352113484137624]
2つの画像間の相対的なポーズを推定する新しい手法を提案する。キーポイント検出,説明抽出,マッチング,ロバストなポーズ推定を共同で学習する。本研究では,既知のポーズを持つ画像データベース内でのクエリ画像の視覚的局在化の手法を示す。
論文参考訳（メタデータ） (2021-04-02T15:16:17Z)
Paying Attention to Activation Maps in Camera Pose Regression [4.232614032390374]
カメラポーズ回帰手法は、クエリ画像に単一のフォワードパスを適用してカメラポーズを推定する。畳み込みアクティベーションマップをシーケンシャル入力として使用するポーズ回帰のための注意に基づくアプローチを提案する。提案手法は,現代のポーズレグレッサー方式に好適に比較し,複数のベンチマークにまたがる最先端の精度を実現する。
論文参考訳（メタデータ） (2021-03-21T20:10:15Z)
Image Matching across Wide Baselines: From Paper to Practice [80.9424750998559]
局所的な特徴とロバストな推定アルゴリズムの包括的なベンチマークを導入する。パイプラインのモジュール構造は、さまざまなメソッドの容易な統合、構成、組み合わせを可能にします。適切な設定で、古典的な解決策は依然として芸術の知覚された状態を上回る可能性があることを示す。
論文参考訳（メタデータ） (2020-03-03T15:20:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。