論文の概要: Wide-Baseline Relative Camera Pose Estimation with Directional Learning
- arxiv url: http://arxiv.org/abs/2106.03336v1
- Date: Mon, 7 Jun 2021 04:46:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-09 13:01:27.874480
- Title: Wide-Baseline Relative Camera Pose Estimation with Directional Learning
- Title(参考訳): 方向学習による広ベース相対カメラポーズ推定
- Authors: Kefan Chen, Noah Snavely, Ameesh Makadia
- Abstract要約: 提案するDirectionNetは,新しいパラメータ化を用いて5次元相対ポーズ空間上の離散分布を推定し,推定問題を抽出できるようにする。
本研究では,Matterport3DとInstituteNetから構築した合成・実ポーズ推定データセットについて検討した。
- 参考スコア(独自算出の注目度): 46.21836501895394
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern deep learning techniques that regress the relative camera pose between
two images have difficulty dealing with challenging scenarios, such as large
camera motions resulting in occlusions and significant changes in perspective
that leave little overlap between images. These models continue to struggle
even with the benefit of large supervised training datasets. To address the
limitations of these models, we take inspiration from techniques that show
regressing keypoint locations in 2D and 3D can be improved by estimating a
discrete distribution over keypoint locations. Analogously, in this paper we
explore improving camera pose regression by instead predicting a discrete
distribution over camera poses. To realize this idea, we introduce
DirectionNet, which estimates discrete distributions over the 5D relative pose
space using a novel parameterization to make the estimation problem tractable.
Specifically, DirectionNet factorizes relative camera pose, specified by a 3D
rotation and a translation direction, into a set of 3D direction vectors. Since
3D directions can be identified with points on the sphere, DirectionNet
estimates discrete distributions on the sphere as its output. We evaluate our
model on challenging synthetic and real pose estimation datasets constructed
from Matterport3D and InteriorNet. Promising results show a near 50% reduction
in error over direct regression methods.
- Abstract(参考訳): 2つの画像間の相対的なカメラのポーズを遅らせる現代のディープラーニング技術は、大きなカメラの動きや、画像間の重複をほとんど残さない視点の著しい変化など、困難なシナリオを扱うのに苦労している。
これらのモデルは、大規模な教師付きトレーニングデータセットの恩恵を受けても、引き続き苦労している。
これらのモデルの限界に対処するために,キーポイント位置の離散分布を推定することにより,キーポイント位置を2次元および3次元で後退させる手法から着想を得た。
同様に,本稿では,カメラポーズの離散分布を予測してカメラポーズ回帰を改善する。
そこで本研究では, 5次元相対ポーズ空間上の離散分布を新しいパラメータ化を用いて推定し, 推定問題を扱いやすくする方向ネットを提案する。
具体的には、3d回転と翻訳方向によって特定される相対カメラポーズを、一連の3d方向ベクトルに分解する。
3次元方向は球面上の点と同一視できるため、DirectionNetは球面上の離散分布をその出力として推定する。
本研究では,matterport3d と interiornet から構築した合成および実ポーズ推定データセットに関するモデルを評価する。
その結果, 直接回帰法よりも50%近い誤差が減少した。
関連論文リスト
- SCIPaD: Incorporating Spatial Clues into Unsupervised Pose-Depth Joint Learning [17.99904937160487]
本研究では,教師なし深層学習のための空間的手がかりを取り入れた新しいアプローチであるSCIPaDを紹介する。
SCIPaDは平均翻訳誤差22.2%、カメラポーズ推定タスクの平均角誤差34.8%をKITTI Odometryデータセットで達成している。
論文 参考訳(メタデータ) (2024-07-07T06:52:51Z) - UPose3D: Uncertainty-Aware 3D Human Pose Estimation with Cross-View and Temporal Cues [55.69339788566899]
UPose3Dは多視点人間のポーズ推定のための新しいアプローチである。
直接的な3Dアノテーションを必要とせずに、堅牢性と柔軟性を向上させる。
論文 参考訳(メタデータ) (2024-04-23T00:18:00Z) - Cameras as Rays: Pose Estimation via Ray Diffusion [54.098613859015856]
カメラのポーズを推定することは3D再構成の基本的な課題であり、まばらにサンプリングされたビューを考えると依然として困難である。
本稿では,カメラを光束として扱うカメラポーズの分散表現を提案する。
提案手法は回帰法と拡散法の両方で,CO3Dのカメラポーズ推定における最先端性能を示す。
論文 参考訳(メタデータ) (2024-02-22T18:59:56Z) - iComMa: Inverting 3D Gaussian Splatting for Camera Pose Estimation via Comparing and Matching [14.737266480464156]
コンピュータビジョンにおける6次元カメラのポーズ推定問題に対処するため,iComMaという手法を提案する。
3次元ガウススプラッティング(3DGS)の反転による高精度カメラポーズ推定法を提案する。
論文 参考訳(メタデータ) (2023-12-14T15:31:33Z) - FrozenRecon: Pose-free 3D Scene Reconstruction with Frozen Depth Models [67.96827539201071]
本稿では,3次元シーン再構成のための新しいテスト時間最適化手法を提案する。
本手法は5つのゼロショットテストデータセット上で,最先端のクロスデータセット再構築を実現する。
論文 参考訳(メタデータ) (2023-08-10T17:55:02Z) - CameraPose: Weakly-Supervised Monocular 3D Human Pose Estimation by
Leveraging In-the-wild 2D Annotations [25.05308239278207]
一つの画像から3次元のポーズ推定を行うための弱教師付きフレームワークであるCameraPoseを提案する。
カメラパラメータブランチを追加することで、Wildの2Dアノテーションをパイプラインに投入して、トレーニングの多様性を高めることができます。
また、2次元ポーズ推定器によって抽出されたノイズの多い2Dキーポイントの品質をさらに向上させるため、信頼誘導損失を有する改良型ネットワークモジュールも導入する。
論文 参考訳(メタデータ) (2023-01-08T05:07:41Z) - MetaPose: Fast 3D Pose from Multiple Views without 3D Supervision [72.5863451123577]
正確な3Dポーズとカメラ推定が可能なニューラルモデルをトレーニングする方法を示す。
本手法は,古典的バンドル調整と弱教師付き単分子3Dベースラインの両方に優れる。
論文 参考訳(メタデータ) (2021-08-10T18:39:56Z) - Uncertainty-Aware Camera Pose Estimation from Points and Lines [101.03675842534415]
Perspective-n-Point-and-Line (Pn$PL) は、2D-3D特徴座標の3Dモデルに関して、高速で正確で堅牢なカメラローカライゼーションを目指している。
論文 参考訳(メタデータ) (2021-07-08T15:19:36Z) - Beyond Weak Perspective for Monocular 3D Human Pose Estimation [6.883305568568084]
単眼映像からの3次元関節位置と方向予測の課題を考察する。
まず,市販のポーズ推定アルゴリズムを用いて2次元関節位置を推定する。
次に、初期パラメータを受信するSMPLifyアルゴリズムに準拠する。
論文 参考訳(メタデータ) (2020-09-14T16:23:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。