論文の概要: GMatch: Geometry-Constrained Feature Matching for RGB-D Object Pose Estimation
- arxiv url: http://arxiv.org/abs/2505.16144v1
- Date: Thu, 22 May 2025 02:39:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-23 17:12:47.986398
- Title: GMatch: Geometry-Constrained Feature Matching for RGB-D Object Pose Estimation
- Title(参考訳): GMatch:RGB-Dオブジェクトポス推定のための幾何制約付き特徴マッチング
- Authors: Ming Yang, Haoran Li,
- Abstract要約: GMatchは、堅牢な6DoFオブジェクトポーズ推定のための学習不要の機能マーカである。
GMatchはガイド付きインクリメンタル検索を行い、マッチングプロセス全体を通してSE(3)不変な幾何一貫性を強制する。
GMatch-SIFTは汎用的なポーズ推定パイプラインを形成し、多様なオブジェクトやシーンに対して強い解釈性と一般化を提供する。
- 参考スコア(独自算出の注目度): 8.335949758778405
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present GMatch, a learning-free feature matcher designed for robust 6DoF object pose estimation, addressing common local ambiguities in sparse feature matching. Unlike traditional methods that rely solely on descriptor similarity, GMatch performs a guided, incremental search, enforcing SE(3)-invariant geometric consistency throughout the matching process. It leverages a provably complete set of geometric features that uniquely determine 3D keypoint configurations, ensuring globally consistent correspondences without the need for training or GPU support. When combined with classical descriptors such as SIFT, GMatch-SIFT forms a general-purpose pose estimation pipeline that offers strong interpretability and generalization across diverse objects and scenes. Experiments on the HOPE dataset show that GMatch outperforms both traditional and learning-based matchers, with GMatch-SIFT achieving or surpassing the performance of instance-level pose networks. On the YCB-Video dataset, GMatch-SIFT demonstrates high accuracy and low variance on texture-rich objects. These results not only validate the effectiveness of GMatch-SIFT for object pose estimation but also highlight the broader applicability of GMatch as a general-purpose feature matcher. Code will be released upon acceptance.
- Abstract(参考訳): 我々は,頑健な6DoFオブジェクトのポーズ推定のために設計された学習不要な特徴マッチングであるGMatchを紹介し,スパース特徴マッチングにおける局所的曖昧性に対処する。
記述子類似性にのみ依存する従来の方法とは異なり、GMatchはガイド付きインクリメンタル検索を行い、SE(3)不変な幾何一貫性をマッチングプロセス全体を通して強制する。
3Dキーポイントの設定をユニークに決定し、トレーニングやGPUサポートを必要とせずに、グローバルに一貫した対応を保証する。
SIFTのような古典的な記述子と組み合わせることで、GMatch-SIFTは多種多様なオブジェクトやシーンに対して強い解釈性と一般化を提供する汎用的なポーズ推定パイプラインを形成する。
HOPEデータセットの実験では、GMatchは従来型と学習型両方のマーカよりも優れており、GMatch-SIFTはインスタンスレベルのポーズネットワークのパフォーマンスを達成または上回っている。
YCB-Videoデータセットでは、GMatch-SIFTはテクスチャリッチなオブジェクトに対して高い精度と低分散を示す。
これらの結果は、オブジェクトポーズ推定におけるGMatch-SIFTの有効性を検証するだけでなく、汎用的特徴マーカとしてのGMatchの適用性も強調する。
コードは受理時にリリースされる。
関連論文リスト
- Learning Fine-Grained Correspondence with Cross-Perspective Perception for Open-Vocabulary 6D Object Pose Estimation [14.262846967061947]
微粒化対応ポース推定(FiCoP)は、ノイズの発するグローバルマッチングから空間的に制約されたパッチレベル対応へ移行するフレームワークである。
FiCoPは、最先端の手法と比較して平均リコールを8.0%と6.1%改善する。
論文 参考訳(メタデータ) (2026-01-20T03:48:54Z) - Leveraging CVAE for Joint Configuration Estimation of Multifingered Grippers from Point Cloud Data [1.3124513975412255]
本稿では,多関節鎖の点雲データのみから多指グリップの関節構成を決定するための効率的な手法を提案する。
本研究では,重要な構造要素の点クラウドデータを入力として取り込んだ条件変分自動エンコーダ(CVAE)を用いて,対応する関節構成を再構築する。
我々は、Allegro Handを用いたマルチデックス把握データセットに対するアプローチを検証し、0.05ミリ秒以内で動作し、最先端の手法に匹敵する精度を実現する。
論文 参考訳(メタデータ) (2025-11-21T14:31:39Z) - You Only Estimate Once: Unified, One-stage, Real-Time Category-level Articulated Object 6D Pose Estimation for Robotic Grasping [119.41166438439313]
YOEOは、エンドツーエンドでインスタンスセグメンテーションとNPCS表現を出力する単一ステージのメソッドである。
我々は、統一ネットワークを使用してポイントワイズセマンティックラベルとセントロイドオフセットを生成し、同じパートインスタンスのポイントが同じセントロイドに投票できるようにする。
また,合成学習したモデルを実環境に展開し,200Hzでリアルタイムな視覚フィードバックを提供する。
論文 参考訳(メタデータ) (2025-06-06T03:49:20Z) - To Glue or Not to Glue? Classical vs Learned Image Matching for Mobile Mapping Cameras to Textured Semantic 3D Building Models [5.4693951128908935]
本研究は、テクスチャ化されたCityGML LoD2モデルを用いて、視覚的位置決めにおける異なる特徴マッチング手法の有効性を体系的に評価する。
その結果,学習可能な特徴マッチング手法は,精度とロバスト性に関して従来の手法よりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2025-05-23T14:41:41Z) - Robust Markov stability for community detection at a scale learned based on the structure [0.0]
本稿では、PyGenStabilityが生成する複数のパーティションから、1つのロバストなパーティションを適切なスケールで選択するための原則的手法を提案する。
提案手法は,マルコフ安定性フレームワークと事前学習された機械学習モデルを組み合わせて,スケール選択を行う。
PyGenStabilityOne (PO) は他の25のアルゴリズムよりも統計的に有意なマージンで優れていることを示す。
論文 参考訳(メタデータ) (2025-04-15T21:16:14Z) - MatchU: Matching Unseen Objects for 6D Pose Estimation from RGB-D Images [57.71600854525037]
RGB-D画像からの6次元ポーズ推定のためのFuse-Describe-Match戦略を提案する。
MatchUは、2Dテクスチャと6Dポーズ予測のための3D幾何学的手がかりを融合する汎用的なアプローチである。
論文 参考訳(メタデータ) (2024-03-03T14:01:03Z) - RGM: A Robust Generalizable Matching Model [49.60975442871967]
RGM(Robust Generalist Matching)と呼ばれる疎密マッチングのための深部モデルを提案する。
合成トレーニングサンプルと実世界のシナリオのギャップを狭めるために、我々は、疎対応基盤真理を持つ新しい大規模データセットを構築した。
さまざまな密集したスパースなデータセットを混ぜ合わせることができ、トレーニングの多様性を大幅に改善しています。
論文 参考訳(メタデータ) (2023-10-18T07:30:08Z) - Q-REG: End-to-End Trainable Point Cloud Registration with Surface
Curvature [81.25511385257344]
本稿では、リッチな幾何学的情報を用いて、単一の対応から剛性ポーズを推定する新しい解Q-REGを提案する。
Q-REGは、堅牢な推定を徹底的な探索として形式化し、エンドツーエンドのトレーニングを可能にする。
実験では、Q-REGは対応マッチング法に非依存であり、推論とエンドツーエンドトレーニングの両方で使用した場合に一貫した改善を提供する。
論文 参考訳(メタデータ) (2023-09-27T20:58:53Z) - TTPOINT: A Tensorized Point Cloud Network for Lightweight Action
Recognition with Event Cameras [5.925545594655497]
イベントカメラは、従来のフレームベースの手法と互換性のないスパースおよび非同期データを生成する。
我々は,動作認識タスクにおけるSOTA(State-of-the-art)フレームベースの手法と比較しても,結果が得られるTTPOINTというポイントクラウドネットワークを提案する。
論文 参考訳(メタデータ) (2023-08-19T11:58:31Z) - Explicit Correspondence Matching for Generalizable Neural Radiance
Fields [49.49773108695526]
本稿では,新たな未知のシナリオに一般化し,2つのソースビューで新規なビュー合成を行う新しいNeRF手法を提案する。
明瞭な対応マッチングは、異なるビュー上の3Dポイントの2次元投影でサンプリングされた画像特徴間のコサイン類似度と定量化される。
実験では,実験結果から得られたコサイン特徴の類似性と体積密度との間に強い相関関係が認められた。
論文 参考訳(メタデータ) (2023-04-24T17:46:01Z) - OAMatcher: An Overlapping Areas-based Network for Accurate Local Feature
Matching [9.006654114778073]
OAMatcherは、人間の動作を模倣して、密集した正確な一致を生成する、検知不要な手法である。
OAMatcherは重複する領域を予測し、効果的でクリーンなグローバルコンテキストアグリゲーションを促進する。
総合的な実験により、OAMatcherはいくつかのベンチマークで最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2023-02-12T03:32:45Z) - DeepMatcher: A Deep Transformer-based Network for Robust and Accurate
Local Feature Matching [9.662752427139496]
本研究では,検出器レス手法における局所的特徴マッチングの探索に基づくディープトランスフォーマーベースネットワークを提案する。
DeepMatcherは、より直感的でシンプルでマッシュアップな機能をキャプチャする。
我々は、DeepMatcherがいくつかのベンチマークで最先端の手法を大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2023-01-08T07:15:09Z) - Learning to Detect Good Keypoints to Match Non-Rigid Objects in RGB
Images [7.428474910083337]
本稿では,非剛性画像対応タスクの正マッチ数を最大化するために,新しい学習キーポイント検出手法を提案する。
我々のトレーニングフレームワークは、アノテートされた画像対と予め定義された記述子抽出器をマッチングして得られる真の対応を利用して、畳み込みニューラルネットワーク(CNN)を訓練する。
実験の結果,本手法は平均整合精度で20時までに非剛体物体の実像に対して,最先端のキーポイント検出器よりも優れていた。
論文 参考訳(メタデータ) (2022-12-13T11:59:09Z) - Adaptive Assignment for Geometry Aware Local Feature Matching [22.818457285745733]
検出不要な特徴マッチングアプローチは、その優れたパフォーマンスのおかげで、現在大きな注目を集めている。
本稿では,AdaMatcherについて紹介する。AdaMatcherは特徴相関と協調可視領域推定を,精巧な特徴相互作用モジュールを通じて実現する。
次に、AdaMatcherは、画像間のスケールを推定しながらパッチレベルのマッチングに適応的な割り当てを行い、最後に、スケールアライメントとサブピクセルレグレッションモジュールを通じて、コビジブルマッチングを洗練する。
論文 参考訳(メタデータ) (2022-07-18T08:22:18Z) - TransforMatcher: Match-to-Match Attention for Semantic Correspondence [48.25709192748133]
本稿では,視覚領域におけるトランスフォーマーネットワークの成功を基盤として,TransforMatcherと呼ばれる強力なセマンティック画像マッチング学習手法を提案する。
既存の畳み込みや注意に基づく対応スキームとは異なり、TransforMatcherは、正確なマッチングローカライゼーションとダイナミックリファインメントのために、グローバルなマッチングアテンションを実行する。
実験では、TransforMatcherはSPair-71k上の新しい状態を設定し、PF-PASCALデータセット上の既存のSOTAメソッドと同等に動作させる。
論文 参考訳(メタデータ) (2022-05-23T21:02:01Z) - Semantic keypoint-based pose estimation from single RGB frames [64.80395521735463]
一つのRGB画像からオブジェクトの連続6-DoFポーズを推定する手法を提案する。
このアプローチは、畳み込みネットワーク(convnet)によって予測されるセマンティックキーポイントと、変形可能な形状モデルを組み合わせる。
提案手法は,インスタンスベースのシナリオとクラスベースのシナリオの両方に対して,6-DoFオブジェクトのポーズを正確に復元できることを示す。
論文 参考訳(メタデータ) (2022-04-12T15:03:51Z) - Progressive Coordinate Transforms for Monocular 3D Object Detection [52.00071336733109]
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
論文 参考訳(メタデータ) (2021-08-12T15:22:33Z) - SIFT Matching by Context Exposed [7.99536002595393]
本稿では、マッチングコンテキスト情報を利用して、ローカル画像記述子マッチングをステップアップする方法を検討する。
新しいマッチング戦略と,それぞれにブロブマッチング(blob matching)とデラウネー三角法マッチング(Delaunay Triangulation Matching, DTM)と呼ばれる新しい局所空間フィルタが考案された。
DTMは、特に非平面シーンにおいて、精度とロバストさの整合性の観点から、最先端技術よりも同等か優れている。
論文 参考訳(メタデータ) (2021-06-17T15:10:59Z) - 3D Correspondence Grouping with Compatibility Features [51.869670613445685]
本稿では,3次元対応グルーピングのための簡易かつ効果的な手法を提案する。
目的は、局所幾何学的記述子を不整合と外接点にマッチングすることによって得られる初期対応を正確に分類することである。
本稿では,不整合と不整合を表わすために,互換性特徴(CF)と呼ばれる3次元対応の表現を提案する。
論文 参考訳(メタデータ) (2020-07-21T02:39:48Z) - Making Affine Correspondences Work in Camera Geometry Computation [62.7633180470428]
局所的な特徴は、ポイント・ツー・ポイント対応ではなく、リージョン・ツー・リージョンを提供する。
本稿では,全モデル推定パイプラインにおいて,地域間マッチングを効果的に活用するためのガイドラインを提案する。
実験により、アフィンソルバはより高速な実行時にポイントベースソルバに匹敵する精度を達成できることが示された。
論文 参考訳(メタデータ) (2020-07-20T12:07:48Z) - PrimiTect: Fast Continuous Hough Voting for Primitive Detection [49.72425950418304]
本手法は点を平面や円錐などの異なる幾何学的プリミティブに分類し,データのコンパクトな表現につながる。
我々は、プリミティブの局所的で低次元のパラメータ化を使用して、ポイントが属するオブジェクトのタイプ、形状、ポーズを決定する。
これにより、ロボットアプリケーションでしばしば必要とされるように、計算能力の低いデバイス上での動作に適したアルゴリズムが実現されます。
論文 参考訳(メタデータ) (2020-05-15T10:16:07Z) - Image Matching across Wide Baselines: From Paper to Practice [80.9424750998559]
局所的な特徴とロバストな推定アルゴリズムの包括的なベンチマークを導入する。
パイプラインのモジュール構造は、さまざまなメソッドの容易な統合、構成、組み合わせを可能にします。
適切な設定で、古典的な解決策は依然として芸術の知覚された状態を上回る可能性があることを示す。
論文 参考訳(メタデータ) (2020-03-03T15:20:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。