論文の概要: Reassessing the Limitations of CNN Methods for Camera Pose Regression
- arxiv url: http://arxiv.org/abs/2108.07260v1
- Date: Mon, 16 Aug 2021 17:55:26 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-17 14:57:21.744436
- Title: Reassessing the Limitations of CNN Methods for Camera Pose Regression
- Title(参考訳): カメラポッド回帰におけるCNN手法の限界の再評価
- Authors: Tony Ng, Adrian Lopez-Rodriguez, Vassileios Balntas, Krystian
Mikolajczyk
- Abstract要約: 本稿では,カメラのポーズを直接画像から復元できるモデルを提案する。
まず、レグレッションメソッドがまだ最先端にある理由を分析し、新しいアプローチでパフォーマンスギャップを埋める。
- 参考スコア(独自算出の注目度): 27.86655424544118
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we address the problem of camera pose estimation in outdoor
and indoor scenarios. In comparison to the currently top-performing methods
that rely on 2D to 3D matching, we propose a model that can directly regress
the camera pose from images with significantly higher accuracy than existing
methods of the same class. We first analyse why regression methods are still
behind the state-of-the-art, and we bridge the performance gap with our new
approach. Specifically, we propose a way to overcome the biased training data
by a novel training technique, which generates poses guided by a probability
distribution from the training set for synthesising new training views. Lastly,
we evaluate our approach on two widely used benchmarks and show that it
achieves significantly improved performance compared to prior regression-based
methods, retrieval techniques as well as 3D pipelines with local feature
matching.
- Abstract(参考訳): 本稿では,屋外及び屋内シナリオにおけるカメラポーズ推定の問題に対処する。
2Dから3Dのマッチングを頼りにしている現在トップパフォーマンスの手法と比較して,同クラスの既存手法よりもはるかに高い精度で画像からカメラポーズを直接回帰できるモデルを提案する。
まず、回帰メソッドが最先端にある理由を分析し、新しいアプローチでパフォーマンスギャップを橋渡しします。
具体的には,新しいトレーニングビューを合成するためのトレーニングセットから確率分布に導かれたポーズを生成する新しいトレーニング手法により,バイアス付きトレーニングデータを克服する方法を提案する。
最後に,本手法を2つのベンチマークで評価し,従来の回帰型手法,検索手法,局所的特徴マッチングを用いた3dパイプラインと比較して,性能が大幅に向上したことを示す。
関連論文リスト
- FaVoR: Features via Voxel Rendering for Camera Relocalization [23.7893950095252]
カメラ再ローカライズ手法は、高密度画像アライメントから、クエリ画像からの直接カメラポーズ回帰まで様々である。
本稿では,世界規模で疎密だが局所的に密集した2次元特徴の3次元表現を活用する新しい手法を提案する。
一連のフレーム上でのランドマークの追跡と三角測量により、追跡中に観察された画像パッチ記述子をレンダリングするために最適化されたスパースボクセルマップを構築する。
論文 参考訳(メタデータ) (2024-09-11T18:58:16Z) - Cameras as Rays: Pose Estimation via Ray Diffusion [54.098613859015856]
カメラのポーズを推定することは3D再構成の基本的な課題であり、まばらにサンプリングされたビューを考えると依然として困難である。
本稿では,カメラを光束として扱うカメラポーズの分散表現を提案する。
提案手法は回帰法と拡散法の両方で,CO3Dのカメラポーズ推定における最先端性能を示す。
論文 参考訳(メタデータ) (2024-02-22T18:59:56Z) - PoseMatcher: One-shot 6D Object Pose Estimation by Deep Feature Matching [51.142988196855484]
本稿では,PoseMatcherを提案する。
3ビューシステムに基づくオブジェクトと画像のマッチングのための新しいトレーニングパイプラインを作成します。
PoseMatcherは、画像とポイントクラウドの異なる入力モダリティに対応できるように、IO-Layerを導入します。
論文 参考訳(メタデータ) (2023-04-03T21:14:59Z) - DFNet: Enhance Absolute Pose Regression with Direct Feature Matching [16.96571417692014]
絶対ポーズ回帰(APR)と直接特徴マッチングを組み合わせたカメラ再局在パイプラインを導入する。
提案手法は,既存の1画像のAPR手法を最大56%上回る精度で3次元構造法に匹敵する精度を実現する。
論文 参考訳(メタデータ) (2022-04-01T16:39:16Z) - Distribution-Aware Single-Stage Models for Multi-Person 3D Pose
Estimation [29.430404703883084]
本稿では,多人数の3Dポーズ推定問題に対処する新しいDASモデルを提案する。
提案するDASモデルでは,3次元カメラ空間における人物位置と人体関節をワンパスで同時に位置決めする。
CMU Panoptic と MuPoTS-3D のベンチマークに関する総合的な実験は、提案したDASモデルの優れた効率を実証している。
論文 参考訳(メタデータ) (2022-03-15T07:30:27Z) - Poseur: Direct Human Pose Regression with Transformers [119.79232258661995]
単一画像からの2次元人間のポーズ推定に対する直接回帰に基づくアプローチを提案する。
私たちのフレームワークはエンドツーエンドの差別化が可能で、キーポイント間の依存関係を自然に活用することを学びます。
我々のアプローチは、最も優れたヒートマップベースのポーズ推定手法と比較して好意的に機能する最初の回帰ベースのアプローチである。
論文 参考訳(メタデータ) (2022-01-19T04:31:57Z) - Dynamic Iterative Refinement for Efficient 3D Hand Pose Estimation [87.54604263202941]
本稿では,従来の推定値の修正に部分的レイヤを反復的に活用する,小さなディープニューラルネットワークを提案する。
学習したゲーティング基準を用いて、ウェイトシェアリングループから抜け出すかどうかを判断し、モデルにサンプルごとの適応を可能にする。
提案手法は,広く使用されているベンチマークの精度と効率の両面から,最先端の2D/3Dハンドポーズ推定手法より一貫して優れている。
論文 参考訳(メタデータ) (2021-11-11T23:31:34Z) - Learning Eye-in-Hand Camera Calibration from a Single Image [7.262048441360133]
アイ・イン・ハンドカメラのキャリブレーションはロボティクスの基本的かつ長期にわたる問題である。
本稿では,1枚のRGB画像から,この問題をオンラインに解決するための学習的手法について検討する。
論文 参考訳(メタデータ) (2021-11-01T20:17:31Z) - Pose Guided Person Image Generation with Hidden p-Norm Regression [113.41144529452663]
ポーズ誘導者画像生成タスクを解くための新しいアプローチを提案する。
提案手法では,各アイデンティティに対するポーズ不変特徴行列を推定し,対象ポーズに条件づけられたターゲットの出現を予測できる。
提案手法は, 上記すべての変種シナリオにおいて, 競合性能を示す。
論文 参考訳(メタデータ) (2021-02-19T17:03:54Z) - Neural Descent for Visual 3D Human Pose and Shape [67.01050349629053]
入力RGB画像から3次元のポーズと形状を復元するディープニューラルネットワーク手法を提案する。
我々は最近導入された表現力のあるボディ統計モデルGHUMに頼っている。
我々の方法論の中心は、HUmanNeural Descent (HUND)と呼ばれるアプローチの学習と最適化である。
論文 参考訳(メタデータ) (2020-08-16T13:38:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。