論文の概要: IMP: Iterative Matching and Pose Estimation with Adaptive Pooling
- arxiv url: http://arxiv.org/abs/2304.14837v2
- Date: Sun, 11 Jun 2023 16:31:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-14 00:24:31.024138
- Title: IMP: Iterative Matching and Pose Estimation with Adaptive Pooling
- Title(参考訳): IMP: 適応型プールによる反復的マッチングとポース推定
- Authors: Fei Xue and Ignas Budvytis and Roberto Cipolla
- Abstract要約: 我々はEIMPと呼ばれるテキストbfefficient IMPを提案し、潜在的に一致しないキーポイントを動的に破棄する。
YFCC100m、Scannet、Aachen Day-Nightのデータセットに対する実験により、提案手法は精度と効率の点で従来の手法よりも優れていることが示された。
- 参考スコア(独自算出の注目度): 34.36397639248686
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Previous methods solve feature matching and pose estimation using a two-stage
process by first finding matches and then estimating the pose. As they ignore
the geometric relationships between the two tasks, they focus on either
improving the quality of matches or filtering potential outliers, leading to
limited efficiency or accuracy. In contrast, we propose an iterative matching
and pose estimation framework (IMP) leveraging the geometric connections
between the two tasks: a few good matches are enough for a roughly accurate
pose estimation; a roughly accurate pose can be used to guide the matching by
providing geometric constraints. To this end, we implement a geometry-aware
recurrent attention-based module which jointly outputs sparse matches and
camera poses. Specifically, for each iteration, we first implicitly embed
geometric information into the module via a pose-consistency loss, allowing it
to predict geometry-aware matches progressively. Second, we introduce an
\textbf{e}fficient IMP, called EIMP, to dynamically discard keypoints without
potential matches, avoiding redundant updating and significantly reducing the
quadratic time complexity of attention computation in transformers. Experiments
on YFCC100m, Scannet, and Aachen Day-Night datasets demonstrate that the
proposed method outperforms previous approaches in terms of accuracy and
efficiency.
- Abstract(参考訳): 従来の手法では2段階のプロセスを用いて特徴マッチングやポーズ推定を行い、まずマッチングを見つけ、次にポーズを推定する。
2つのタスク間の幾何学的関係を無視するため、マッチの品質向上や潜在的な外れ値のフィルタリングに重点を置いているため、効率や正確性は限られている。
これとは対照的に,2つのタスク間の幾何的接続を利用した反復的マッチングとポーズ推定フレームワーク(IMP)を提案する。
この目的のために我々は,スパースマッチとカメラポーズを共同で出力する幾何学的アレントアレントアレントアテンションベースモジュールを実装した。
具体的には、各イテレーションに対して、まず、ポーズ一貫性の損失を通じて、モジュールに幾何学情報を暗黙的に埋め込む。
第2に,eimpと呼ばれる,冗長な更新を回避し,トランスフォーマの注意計算の二次時間複雑性を著しく低減する,キーポイントを動的に破棄する\textbf{e}fficient impを導入する。
YFCC100m、Scannet、Aachen Day-Nightのデータセットに対する実験により、提案手法は精度と効率の点で従来の手法よりも優れていることが示された。
関連論文リスト
- Robust Two-View Geometry Estimation with Implicit Differentiation [2.048226951354646]
本稿では,新しい2次元幾何推定フレームワークを提案する。
これは微分可能なロバスト損失関数のフィッティングに基づいている。
本研究では,屋外シナリオと屋内シナリオの両方において,カメラポーズ推定タスクに対するアプローチを評価する。
論文 参考訳(メタデータ) (2024-10-23T15:51:33Z) - DVMNet: Computing Relative Pose for Unseen Objects Beyond Hypotheses [59.51874686414509]
現在のアプローチは、多数の離散的なポーズ仮説を持つ連続的なポーズ表現を近似している。
本稿では,DVMNet(Deep Voxel Matching Network)を提案する。
提案手法は,最先端の手法に比べて計算コストの低い新しいオブジェクトに対して,より正確なポーズ推定を行う。
論文 参考訳(メタデータ) (2024-03-20T15:41:32Z) - Q-REG: End-to-End Trainable Point Cloud Registration with Surface
Curvature [81.25511385257344]
本稿では、リッチな幾何学的情報を用いて、単一の対応から剛性ポーズを推定する新しい解Q-REGを提案する。
Q-REGは、堅牢な推定を徹底的な探索として形式化し、エンドツーエンドのトレーニングを可能にする。
実験では、Q-REGは対応マッチング法に非依存であり、推論とエンドツーエンドトレーニングの両方で使用した場合に一貫した改善を提供する。
論文 参考訳(メタデータ) (2023-09-27T20:58:53Z) - A Probabilistic Relaxation of the Two-Stage Object Pose Estimation
Paradigm [0.0]
オブジェクトポーズ推定のためのマッチングのない確率的定式化を提案する。
視覚的対応と幾何学的アライメントの両方を統一的かつ同時に最適化することができる。
これは、おそらくのポーズの分布全体の異なる可算モードを表現することができる。
論文 参考訳(メタデータ) (2023-06-01T16:50:40Z) - PoseMatcher: One-shot 6D Object Pose Estimation by Deep Feature Matching [51.142988196855484]
本稿では,PoseMatcherを提案する。
3ビューシステムに基づくオブジェクトと画像のマッチングのための新しいトレーニングパイプラインを作成します。
PoseMatcherは、画像とポイントクラウドの異なる入力モダリティに対応できるように、IO-Layerを導入します。
論文 参考訳(メタデータ) (2023-04-03T21:14:59Z) - SSP-Pose: Symmetry-Aware Shape Prior Deformation for Direct
Category-Level Object Pose Estimation [77.88624073105768]
カテゴリーレベルのポーズ推定は、クラス内形状の変化によって難しい問題である。
カテゴリレベルのポーズ推定のためのエンドツーエンドのトレーニング可能なネットワークSSP-Poseを提案する。
SSP-Poseは、リアルタイムの推論速度が約25Hzの競合に比べて性能が優れている。
論文 参考訳(メタデータ) (2022-08-13T14:37:31Z) - End2End Multi-View Feature Matching with Differentiable Pose
Optimization [2.311583680973075]
本稿では,信頼度とともに画像の対応性を予測するグラフアテンションネットワークを提案する。
結果の一致は、微分可能なポーズ推定における重み付き制約として機能する。
複数のフレームにまたがってグラフを分散することで、複数のビューからの情報を統合して、マッチを一度に予測します。
論文 参考訳(メタデータ) (2022-05-03T18:00:01Z) - Deep Probabilistic Graph Matching [72.6690550634166]
本稿では,マッチング制約を伴わずに,元のQAPに適合する深層学習ベースのグラフマッチングフレームワークを提案する。
提案手法は,一般的な3つのベンチマーク(Pascal VOC,Wilow Object,SPair-71k)で評価され,すべてのベンチマークにおいて過去の最先端よりも優れていた。
論文 参考訳(メタデータ) (2022-01-05T13:37:27Z) - Augmented Parallel-Pyramid Net for Attention Guided Pose-Estimation [90.28365183660438]
本稿では、注意部分モジュールと微分可能な自動データ拡張を備えた拡張並列ピラミドネットを提案する。
我々は、データ拡張のシーケンスをトレーニング可能なCNNコンポーネントとして定式化する新しいポーズ検索空間を定義する。
特に,本手法は,挑戦的なCOCOキーポイントベンチマークとMPIIデータセットの最先端結果において,トップ1の精度を実現する。
論文 参考訳(メタデータ) (2020-03-17T03:52:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。