論文の概要: End-to-end learning of keypoint detection and matching for relative pose
estimation
- arxiv url: http://arxiv.org/abs/2104.01085v1
- Date: Fri, 2 Apr 2021 15:16:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-05 13:46:58.364294
- Title: End-to-end learning of keypoint detection and matching for relative pose
estimation
- Title(参考訳): 相対ポーズ推定のためのキーポイント検出とマッチングのエンドツーエンド学習
- Authors: Antoine Fond, Luca Del Pero, Nikola Sivacki, Marco Paladini
- Abstract要約: 2つの画像間の相対的なポーズを推定する新しい手法を提案する。
キーポイント検出,説明抽出,マッチング,ロバストなポーズ推定を共同で学習する。
本研究では,既知のポーズを持つ画像データベース内でのクエリ画像の視覚的局在化の手法を示す。
- 参考スコア(独自算出の注目度): 1.8352113484137624
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We propose a new method for estimating the relative pose between two images,
where we jointly learn keypoint detection, description extraction, matching and
robust pose estimation. While our architecture follows the traditional pipeline
for pose estimation from geometric computer vision, all steps are learnt in an
end-to-end fashion, including feature matching. We demonstrate our method for
the task of visual localization of a query image within a database of images
with known pose. Pairwise pose estimation has many practical applications for
robotic mapping, navigation, and AR. For example, the display of persistent AR
objects in the scene relies on a precise camera localization to make the
digital models appear anchored to the physical environment. We train our
pipeline end-to-end specifically for the problem of visual localization. We
evaluate our proposed approach on localization accuracy, robustness and runtime
speed. Our method achieves state of the art localization accuracy on the 7
Scenes dataset.
- Abstract(参考訳): 2つの画像間の相対的なポーズを推定する新しい手法を提案し、キーポイントの検出、記述抽出、マッチング、ロバストなポーズ推定を共同で学習する。
私たちのアーキテクチャは、幾何学的コンピュータビジョンからのポーズ推定のための伝統的なパイプラインに従っていますが、すべてのステップは機能マッチングを含むエンドツーエンドの方法で学習されます。
本手法は,既知のポーズの画像データベース内の問合せ画像の視覚的ローカライズを行うためのものである。
ペアワイズポーズ推定は、ロボットマッピング、ナビゲーション、ARに多くの実用的な応用がある。
例えば、シーン内の永続的なARオブジェクトの表示は、デジタルモデルを物理的な環境に固定するように、正確なカメラのローカライゼーションに依存している。
視覚的なローカライゼーションの問題に特化して、パイプラインをエンドツーエンドにトレーニングします。
提案手法であるローカライズ精度,ロバスト性,実行速度を評価した。
本手法は,7シーンのデータセット上でのアートローカライズ精度を実現する。
関連論文リスト
- KRONC: Keypoint-based Robust Camera Optimization for 3D Car Reconstruction [58.04846444985808]
KRONCは、オブジェクトに関する事前知識を活用して、セマンティックキーポイントを通してその表現を再構築することで、ビューポーズを推論する新しいアプローチである。
車両シーンに焦点を当てたKRONCは、キーポイントのバックプロジェクションを特異点に収束させることを目的とした光最適化問題の解として、ビューの位置を推定することができる。
論文 参考訳(メタデータ) (2024-09-09T08:08:05Z) - Mismatched: Evaluating the Limits of Image Matching Approaches and Benchmarks [9.388897214344572]
2次元画像からの3次元3次元再構成はコンピュータビジョンにおける活発な研究分野である。
伝統的にこの作業にはパラメトリック技術が用いられてきた。
近年の進歩は、学習ベースの方法にシフトしている。
論文 参考訳(メタデータ) (2024-08-29T11:16:34Z) - SRPose: Two-view Relative Pose Estimation with Sparse Keypoints [51.49105161103385]
SRPoseは、カメラ・トゥ・ワールドおよびオブジェクト・トゥ・カメラシナリオにおける2ビュー相対ポーズ推定のためのスパースキーポイントベースのフレームワークである。
精度と速度の点で最先端の手法と比較して、競争力や優れた性能を達成する。
さまざまな画像サイズやカメラ固有の機能に対して堅牢であり、低コンピューティングリソースでデプロイすることができる。
論文 参考訳(メタデータ) (2024-07-11T05:46:35Z) - LocaliseBot: Multi-view 3D object localisation with differentiable
rendering for robot grasping [9.690844449175948]
オブジェクトのポーズ推定に重点を置いています。
このアプローチは,オブジェクトの複数ビュー,それらの視点におけるカメラのパラメータ,オブジェクトの3次元CADモデルという3つの情報に依存している。
推定対象のポーズが99.65%の精度で真理把握候補を把握できることが示される。
論文 参考訳(メタデータ) (2023-11-14T14:27:53Z) - Learning-based Relational Object Matching Across Views [63.63338392484501]
本稿では,RGB画像間のオブジェクト検出をマッチングするための,局所キーポイントと新たなオブジェクトレベルの特徴を組み合わせた学習ベースアプローチを提案する。
我々は、連想グラフニューラルネットワークにおいて、オブジェクト間の外観とフレーム間およびフレーム間空間関係に基づいて、オブジェクトレベルのマッチング機能を訓練する。
論文 参考訳(メタデータ) (2023-05-03T19:36:51Z) - ImPosIng: Implicit Pose Encoding for Efficient Camera Pose Estimation [2.6808541153140077]
暗黙の詩。
(ImPosing)はイメージとカメラのポーズを2つの別々のニューラルネットワークで共通の潜在表現に埋め込む。
階層的な方法で潜在空間を通して候補を評価することにより、カメラの位置と向きを直接回帰するのではなく、洗練する。
論文 参考訳(メタデータ) (2022-05-05T13:33:25Z) - Combining Local and Global Pose Estimation for Precise Tracking of
Similar Objects [2.861848675707602]
類似・非テクスチャオブジェクトに対する多目的6D検出・追跡パイプラインを提案する。
合成画像のみを訓練した新しいネットワークアーキテクチャは、複数のオブジェクトの同時ポーズ推定を可能にする。
建設現場における実際のAR支援アプリケーションにおいて,システムがどのように利用できるかを示す。
論文 参考訳(メタデータ) (2022-01-31T14:36:57Z) - Learning Dynamics via Graph Neural Networks for Human Pose Estimation
and Tracking [98.91894395941766]
ポーズ検出とは無関係なポーズダイナミクスを学習する新しいオンライン手法を提案する。
具体的には、空間的・時間的情報と視覚的情報の両方を明示的に考慮したグラフニューラルネットワーク(GNN)を通して、このダイナミクスの予測を導出する。
PoseTrack 2017とPoseTrack 2018データセットの実験では、提案手法が人間のポーズ推定とトラッキングタスクの両方において、技術の現状よりも優れた結果が得られることを示した。
論文 参考訳(メタデータ) (2021-06-07T16:36:50Z) - Leveraging Photometric Consistency over Time for Sparsely Supervised
Hand-Object Reconstruction [118.21363599332493]
本稿では,ビデオ中のフレームの粗いサブセットに対してのみアノテーションが利用できる場合に,時間とともに光度整合性を活用する手法を提案する。
本モデルでは,ポーズを推定することにより,手や物体を3Dで共同で再構成するカラーイメージをエンドツーエンドに訓練する。
提案手法は,3次元手動画像再構成の精度向上に有効であることを示す。
論文 参考訳(メタデータ) (2020-04-28T12:03:14Z) - GeoGraph: Learning graph-based multi-view object detection with
geometric cues end-to-end [10.349116753411742]
複数のビューから静的な都市オブジェクトを検出するエンド・ツー・エンドの学習可能なアプローチを提案する。
提案手法はグラフニューラルネットワーク(GNN)を用いて全ての物体を検出し,その位置を出力する。
我々のGNNは、相対的なポーズと画像の証拠を同時にモデル化し、任意の数の入力ビューを扱うことができる。
論文 参考訳(メタデータ) (2020-03-23T09:40:35Z) - Geometrically Mappable Image Features [85.81073893916414]
地図内のエージェントの視覚に基づくローカライゼーションは、ロボット工学とコンピュータビジョンにおいて重要な問題である。
本稿では,画像検索を対象とした画像特徴学習手法を提案する。
論文 参考訳(メタデータ) (2020-03-21T15:36:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。