論文の概要: Insights on Evaluation of Camera Re-localization Using Relative Pose
Regression
- arxiv url: http://arxiv.org/abs/2009.11342v1
- Date: Wed, 23 Sep 2020 19:16:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-15 15:26:20.219498
- Title: Insights on Evaluation of Camera Re-localization Using Relative Pose
Regression
- Title(参考訳): 相対的ポーズ回帰を用いたカメラ再局在評価の考察
- Authors: Amir Shalev (1,2), Omer Achrack (2), Brian Fulkerson, and Ben-Zion
Bobrovsky (1) ((1) Tel-Aviv-University, (2) Intel)
- Abstract要約: 視覚的再局在化における相対的ポーズ回帰の問題を考察する。
上記の問題を治療するための3つの新しい指標を提案する。
我々のネットワークは、特に、一つのシーンでのトレーニングは、他のシーンのパフォーマンスをほとんど損なわないことを示す。
- 参考スコア(独自算出の注目度): 0.9236074230806579
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the problem of relative pose regression in visual relocalization.
Recently, several promising approaches have emerged in this area. We claim that
even though they demonstrate on the same datasets using the same split to train
and test, a faithful comparison between them was not available since on
currently used evaluation metric, some approaches might perform favorably,
while in reality performing worse. We reveal a tradeoff between accuracy and
the 3D volume of the regressed subspace. We believe that unlike other
relocalization approaches, in the case of relative pose regression, the
regressed subspace 3D volume is less dependent on the scene and more affect by
the method used to score the overlap, which determined how closely sampled
viewpoints are. We propose three new metrics to remedy the issue mentioned
above. The proposed metrics incorporate statistics about the regression
subspace volume. We also propose a new pose regression network that serves as a
new baseline for this task. We compare the performance of our trained model on
Microsoft 7-Scenes and Cambridge Landmarks datasets both with the standard
metrics and the newly proposed metrics and adjust the overlap score to reveal
the tradeoff between the subspace and performance. The results show that the
proposed metrics are more robust to different overlap threshold than the
conventional approaches. Finally, we show that our network generalizes well,
specifically, training on a single scene leads to little loss of performance on
the other scenes.
- Abstract(参考訳): 視覚再局在化における相対的ポーズ回帰の問題を考える。
近年,この分野では有望なアプローチがいくつか登場している。
私たちは、同じデータセットで同じスプリットを使用してトレーニングとテストを行っているが、それら間の忠実な比較は、現在使われている評価基準では利用できないと主張している。
回帰部分空間の精度と3次元体積のトレードオフを明らかにする。
他の再局在化手法とは異なり、相対的なポーズ回帰の場合、回帰した部分空間の3次元体積はシーンに依存せず、オーバーラップをスコアする手法によってより影響を受け、サンプリングされた視点がどの程度近いかが決定される。
上記の問題を治療するための3つの新しい指標を提案する。
提案手法は回帰部分空間体積に関する統計量を含む。
また,このタスクの新たなベースラインとして機能する新しいポーズ回帰ネットワークを提案する。
Microsoft 7-ScenesとCambridge Landmarksのトレーニングモデルのパフォーマンスを、標準メトリクスと新たに提案されたメトリクスの両方と比較し、オーバーラップスコアを調整することで、サブスペースとパフォーマンスのトレードオフを明らかにする。
その結果,提案手法は従来の手法よりも重なり合いの閾値が強いことがわかった。
最後に,ネットワークの一般化,特に1つのシーンでのトレーニングは,他のシーンのパフォーマンスを損なうことがほとんどないことを示す。
関連論文リスト
- DOR3D-Net: Dense Ordinal Regression Network for 3D Hand Pose Estimation [6.327974053228352]
我々は高次回帰問題として3次元手ポーズ推定を再定式化する。
我々はDOR3D-Net(Dense Ordinal Regression 3D Pose Network)を提案する。
我々の設計はSOTA法よりも大幅に改善されている。
論文 参考訳(メタデータ) (2024-03-20T08:47:51Z) - Enhancing Consistency and Mitigating Bias: A Data Replay Approach for
Incremental Learning [100.7407460674153]
ディープラーニングシステムは、一連のタスクから学ぶとき、破滅的な忘れがちだ。
問題を緩和するため、新しいタスクを学ぶ際に経験豊富なタスクのデータを再生する手法が提案されている。
しかし、メモリ制約やデータプライバシーの問題を考慮すると、実際には期待できない。
代替として、分類モデルからサンプルを反転させることにより、データフリーなデータ再生法を提案する。
論文 参考訳(メタデータ) (2024-01-12T12:51:12Z) - Consensus-Adaptive RANSAC [104.87576373187426]
本稿では,パラメータ空間の探索を学習する新しいRANSACフレームワークを提案する。
注意機構は、ポイント・ツー・モデル残差のバッチで動作し、軽量のワンステップ・トランスフォーマーで見いだされたコンセンサスを考慮するために、ポイント・ツー・モデル推定状態を更新する。
論文 参考訳(メタデータ) (2023-07-26T08:25:46Z) - LoLep: Single-View View Synthesis with Locally-Learned Planes and
Self-Attention Occlusion Inference [66.45326873274908]
本稿では,1枚のRGB画像から局所学習平面を回帰してシーンを正確に表現するLoLepを提案する。
MINEと比較して、LPIPSは4.8%-9.0%、RVは73.9%-83.5%である。
論文 参考訳(メタデータ) (2023-07-23T03:38:55Z) - Evaluating Graph Neural Networks for Link Prediction: Current Pitfalls
and New Benchmarking [66.83273589348758]
リンク予測は、グラフのエッジの一部のみに基づいて、目に見えないエッジが存在するかどうかを予測しようとする。
近年,この課題にグラフニューラルネットワーク(GNN)を活用すべく,一連の手法が導入されている。
これらの新しいモデルの有効性をよりよく評価するために、新しい多様なデータセットも作成されている。
論文 参考訳(メタデータ) (2023-06-18T01:58:59Z) - RELMOBNET: A Robust Two-Stage End-To-End Training Approach For
MOBILENETV3 Based Relative Camera Pose Estimation [0.6193838300896449]
相対カメラポーズ推定は3次元再構成と視覚的位置推定において重要な役割を担っている。
本稿では,MobileNetV3-LargeをベースとしたSiameseネットワークを提案する。
論文 参考訳(メタデータ) (2022-02-25T17:27:26Z) - LENS: Localization enhanced by NeRF synthesis [3.4386226615580107]
アルゴリズムのNeRFクラスによって描画された追加の合成データセットにより、カメラポーズの回帰が向上することを示す。
我々はさらに、トレーニング中のデータ拡張として、合成現実的および幾何学的一貫した画像を用いて、ポーズ回帰器の局所化精度を向上した。
論文 参考訳(メタデータ) (2021-10-13T08:15:08Z) - Reassessing the Limitations of CNN Methods for Camera Pose Regression [27.86655424544118]
本稿では,カメラのポーズを直接画像から復元できるモデルを提案する。
まず、レグレッションメソッドがまだ最先端にある理由を分析し、新しいアプローチでパフォーマンスギャップを埋める。
論文 参考訳(メタデータ) (2021-08-16T17:55:26Z) - Bottom-Up Human Pose Estimation Via Disentangled Keypoint Regression [81.05772887221333]
従来のキーポイント検出およびグループ化フレームワークに劣る密度の高いキーポイント回帰フレームワークについて検討する。
我々は,dekr(disentangled keypoint regression)という,単純かつ効果的な手法を提案する。
提案手法はキーポイント検出法やグループ化法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-06T05:54:46Z) - Learning Nonparametric Human Mesh Reconstruction from a Single Image
without Ground Truth Meshes [56.27436157101251]
そこで本研究では,人間のメッシュ再構築を基礎となる真理メッシュを使わずに学習する手法を提案する。
これはグラフ畳み込みニューラルネットワーク(Graph CNN)の損失関数に2つの新しい用語を導入することで実現される。
論文 参考訳(メタデータ) (2020-02-28T20:30:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。