論文の概要: Homography-Based Loss Function for Camera Pose Regression
- arxiv url: http://arxiv.org/abs/2205.01937v1
- Date: Wed, 4 May 2022 08:15:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-05 15:10:28.211264
- Title: Homography-Based Loss Function for Camera Pose Regression
- Title(参考訳): カメラポーズ回帰のためのホモグラフィに基づく損失関数
- Authors: Cl\'ementin Boittiaux (IFREMER), Ricard Marxer (LIS), Claire Dune
(COSMER), Aur\'elien Arnaubec (IFREMER), Vincent Hugel (COSMER)
- Abstract要約: 本稿では,2つのポーズ間の誤差を埋め込んで,深層学習に基づくカメラポーズの回帰を行う損失関数に着目した。
既存の損失関数は、修正が難しい多目的関数か、不安定な再射誤差を示すかのいずれかである。
本稿では,多面的ホモグラフィ統合に基づく新たな損失関数を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Some recent visual-based relocalization algorithms rely on deep learning
methods to perform camera pose regression from image data. This paper focuses
on the loss functions that embed the error between two poses to perform deep
learning based camera pose regression. Existing loss functions are either
difficult-to-tune multi-objective functions or present unstable reprojection
errors that rely on ground truth 3D scene points and require a two-step
training. To deal with these issues, we introduce a novel loss function which
is based on a multiplane homography integration. This new function does not
require prior initialization and only depends on physically interpretable
hyperparameters. Furthermore, the experiments carried out on well established
relocalization datasets show that it minimizes best the mean square
reprojection error during training when compared with existing loss functions.
- Abstract(参考訳): 最近のビジュアルベース再ローカライズアルゴリズムは、画像データからカメラポーズの回帰を行うためのディープラーニング手法に依存している。
本稿では,2つのポーズ間の誤差を埋め込んで,深層学習に基づくカメラポーズ回帰を行う損失関数に着目した。
既存の損失関数は、訓練が難しい多目的関数か、地上の真理3Dシーンポイントに依存する不安定な再射誤差であり、2段階の訓練を必要とする。
これらの問題に対処するために,多面的ホモグラフィ統合に基づく新しい損失関数を導入する。
この新しい関数は事前初期化を必要とせず、物理的に解釈可能なハイパーパラメータのみに依存する。
さらに,十分に確立された再局在化データセット上で行った実験により,既存の損失関数と比較してトレーニング中の平均正方形再投影誤差が最小となることを示した。
関連論文リスト
- FILP-3D: Enhancing 3D Few-shot Class-incremental Learning with
Pre-trained Vision-Language Models [62.663113296987085]
クラス増分学習(class-incremental learning)は、モデルが限られたデータに基づいて漸進的にトレーニングされている場合、破滅的な忘れの問題を軽減することを目的としている。
冗長特徴除去器(RFE)と空間ノイズ補償器(SNC)の2つの新しいコンポーネントを紹介する。
既存の3次元データセットの不均衡を考慮し、3次元FSCILモデルのより微妙な評価を提供する新しい評価指標を提案する。
論文 参考訳(メタデータ) (2023-12-28T14:52:07Z) - Lifting by Image -- Leveraging Image Cues for Accurate 3D Human Pose
Estimation [10.374944534302234]
2次元ポーズからのリフト」法が3Dヒューマンポーズ推定の主流となっている(3DHPE)
画像中のリッチな意味とテクスチャ情報は、より正確な「リフト」手順に寄与する。
本稿では, 一般化問題の原因と画像特徴の有効性について, 新たな知見を与える。
論文 参考訳(メタデータ) (2023-12-25T07:50:58Z) - Online Loss Function Learning [13.744076477599707]
ロス関数学習は、機械学習モデルの損失関数を設計するタスクを自動化することを目的としている。
基本モデルパラメータへの更新毎に,損失関数をオンラインに適応的に更新する新しい損失関数学習手法を提案する。
論文 参考訳(メタデータ) (2023-01-30T19:22:46Z) - Few-View Object Reconstruction with Unknown Categories and Camera Poses [80.0820650171476]
この研究は、カメラのポーズやオブジェクトのカテゴリを知らない少数の画像から、一般的な現実世界のオブジェクトを再構築する。
私たちの研究の要点は、形状再構成とポーズ推定という、2つの基本的な3D視覚問題を解決することです。
提案手法は,各ビューから3次元特徴を予測し,それらを入力画像と組み合わせて活用し,クロスビュー対応を確立する。
論文 参考訳(メタデータ) (2022-12-08T18:59:02Z) - Multi-task Learning for Camera Calibration [3.274290296343038]
一対の画像から内在性(主点オフセットと焦点長)と外因性(ベースライン,ピッチ,翻訳)を予測できるユニークな手法を提案する。
カメラモデルニューラルネットワークを用いて3Dポイントを再構成し、再構成の損失を利用してカメラ仕様を得ることにより、この革新的なカメラ投影損失(CPL)法により、所望のパラメータを推定できる。
論文 参考訳(メタデータ) (2022-11-22T17:39:31Z) - Contrastive Feature Loss for Image Prediction [55.373404869092866]
教師付き画像合成モデルのトレーニングでは、批評家は2つの画像を比較する必要がある。
本稿では,2つの画像間の類似度を測定するための情報理論に基づくアプローチを提案する。
この定式化により,L1損失の代替として,出力画像の知覚的リアリズムが向上することを示す。
論文 参考訳(メタデータ) (2021-11-12T20:39:52Z) - Reassessing the Limitations of CNN Methods for Camera Pose Regression [27.86655424544118]
本稿では,カメラのポーズを直接画像から復元できるモデルを提案する。
まず、レグレッションメソッドがまだ最先端にある理由を分析し、新しいアプローチでパフォーマンスギャップを埋める。
論文 参考訳(メタデータ) (2021-08-16T17:55:26Z) - Uncertainty-Aware Camera Pose Estimation from Points and Lines [101.03675842534415]
Perspective-n-Point-and-Line (Pn$PL) は、2D-3D特徴座標の3Dモデルに関して、高速で正確で堅牢なカメラローカライゼーションを目指している。
論文 参考訳(メタデータ) (2021-07-08T15:19:36Z) - Neural Reprojection Error: Merging Feature Learning and Camera Pose
Estimation [38.47125921410426]
Reprojection Errors (RE) の代替として Neural Reprojection Error (NRE) を紹介します。
NREは、機能学習問題と組み合わせることで、カメラのポーズ推定問題を再考することができる。
また,カメラのポーズに関して,NRE項の和を極めて効率的に最小化できる粗大な最適化手法を提案する。
論文 参考訳(メタデータ) (2021-03-12T09:00:28Z) - Learning Condition Invariant Features for Retrieval-Based Localization
from 1M Images [85.81073893916414]
我々は、より正確で、より一般化されたローカライゼーション特徴を学習する新しい方法を開発した。
難易度の高いオックスフォード・ロボットカーの夜間条件では、5m以内の局所化精度でよく知られた三重項損失を24.4%上回っている。
論文 参考訳(メタデータ) (2020-08-27T14:46:22Z) - Neural Descent for Visual 3D Human Pose and Shape [67.01050349629053]
入力RGB画像から3次元のポーズと形状を復元するディープニューラルネットワーク手法を提案する。
我々は最近導入された表現力のあるボディ統計モデルGHUMに頼っている。
我々の方法論の中心は、HUmanNeural Descent (HUND)と呼ばれるアプローチの学習と最適化である。
論文 参考訳(メタデータ) (2020-08-16T13:38:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。