論文の概要: GMatch: A Lightweight, Geometry-Constrained Keypoint Matcher for Zero-Shot 6DoF Pose Estimation in Robotic Grasp Tasks
- arxiv url: http://arxiv.org/abs/2505.16144v2
- Date: Sun, 19 Oct 2025 00:56:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 00:56:38.329281
- Title: GMatch: A Lightweight, Geometry-Constrained Keypoint Matcher for Zero-Shot 6DoF Pose Estimation in Robotic Grasp Tasks
- Title(参考訳): GMatch: ロボットグラス作業におけるゼロショット6DoF位置推定のための軽量かつ幾何学的に制約されたキーポイントマッチング
- Authors: Ming Yang, Haoran Li,
- Abstract要約: 6DoFオブジェクトのポーズ推定はロボットグリップタスクの基本となる。
GMatchは軽量で、幾何学的に制約されたキーポイントマーカで、組み込みCPUのみのプラットフォーム上で効率的に動作する。
- 参考スコア(独自算出の注目度): 9.107487205419604
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: 6DoF object pose estimation is fundamental to robotic grasp tasks. While recent learning-based methods achieve high accuracy, their computational demands hinder deployment on resource-constrained mobile platforms. In this work, we revisit the classical keypoint matching paradigm and propose GMatch, a lightweight, geometry-constrained keypoint matcher that can run efficiently on embedded CPU-only platforms. GMatch works with keypoint descriptors and it uses a set of geometric constraints to establishes inherent ambiguities between features extracted by descriptors, thus giving a globally consistent correspondences from which 6DoF pose can be easily solved. We benchmark GMatch on the HOPE and YCB-Video datasets, where our method beats existing keypoint matchers (both feature-based and geometry-based) among three commonly used descriptors and approaches the SOTA zero-shot method on texture-rich objects with much more humble devices. The method is further deployed on a LoCoBot mobile manipulator, enabling a one-shot grasp pipeline that demonstrates high task success rates in real-world experiments. In a word, by its lightweight and white-box nature, GMatch offers a practical solution for resource-limited robotic systems, and although currently bottlenecked by descriptor quality, the framework presents a promising direction towards robust yet efficient pose estimation. Code will be released soon under Mozilla Public License.
- Abstract(参考訳): 6DoFオブジェクトのポーズ推定はロボットグリップタスクの基本となる。
近年の学習に基づく手法は精度が高いが,その計算要求は資源制約のあるモバイルプラットフォームへの展開を妨げている。
本稿では,従来のキーポイントマッチングパラダイムを再検討し,組み込みCPUのみのプラットフォーム上で効率的に動作可能な軽量かつ幾何学的に制約されたキーポイントマッチングであるGMatchを提案する。
GMatchはキーポイント記述子と連携し、幾何的制約を用いて記述子によって抽出された特徴間の固有のあいまいさを確立する。
我々はHOPEとYCB-Videoのデータセット上でGMatchをベンチマークし、一般的な3つの記述子のうち、既存のキーポイントマッチング(特徴ベースと幾何学ベースの両方)を破り、より謙虚なデバイスを持つテクスチャリッチなオブジェクトに対するSOTAゼロショット法にアプローチした。
この方法はLoCoBotモバイルマニピュレータにさらに展開され、実際の実験で高いタスク成功率を示すワンショットグリップパイプラインを可能にする。
一言で言えば、GMatchは軽量でホワイトボックス的な性質により、リソース制限されたロボットシステムに対して実用的なソリューションを提供しており、現在はディスクリプタの品質によってボトルネックになっているが、このフレームワークは堅牢で効率的なポーズ推定に向けて有望な方向を示している。
コードはまもなくMozilla Public Licenseの下でリリースされる。
関連論文リスト
- To Glue or Not to Glue? Classical vs Learned Image Matching for Mobile Mapping Cameras to Textured Semantic 3D Building Models [5.4693951128908935]
本研究は、テクスチャ化されたCityGML LoD2モデルを用いて、視覚的位置決めにおける異なる特徴マッチング手法の有効性を体系的に評価する。
その結果,学習可能な特徴マッチング手法は,精度とロバスト性に関して従来の手法よりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2025-05-23T14:41:41Z) - MatchU: Matching Unseen Objects for 6D Pose Estimation from RGB-D Images [57.71600854525037]
RGB-D画像からの6次元ポーズ推定のためのFuse-Describe-Match戦略を提案する。
MatchUは、2Dテクスチャと6Dポーズ予測のための3D幾何学的手がかりを融合する汎用的なアプローチである。
論文 参考訳(メタデータ) (2024-03-03T14:01:03Z) - RGM: A Robust Generalizable Matching Model [49.60975442871967]
RGM(Robust Generalist Matching)と呼ばれる疎密マッチングのための深部モデルを提案する。
合成トレーニングサンプルと実世界のシナリオのギャップを狭めるために、我々は、疎対応基盤真理を持つ新しい大規模データセットを構築した。
さまざまな密集したスパースなデータセットを混ぜ合わせることができ、トレーニングの多様性を大幅に改善しています。
論文 参考訳(メタデータ) (2023-10-18T07:30:08Z) - Q-REG: End-to-End Trainable Point Cloud Registration with Surface
Curvature [81.25511385257344]
本稿では、リッチな幾何学的情報を用いて、単一の対応から剛性ポーズを推定する新しい解Q-REGを提案する。
Q-REGは、堅牢な推定を徹底的な探索として形式化し、エンドツーエンドのトレーニングを可能にする。
実験では、Q-REGは対応マッチング法に非依存であり、推論とエンドツーエンドトレーニングの両方で使用した場合に一貫した改善を提供する。
論文 参考訳(メタデータ) (2023-09-27T20:58:53Z) - Explicit Correspondence Matching for Generalizable Neural Radiance
Fields [49.49773108695526]
本稿では,新たな未知のシナリオに一般化し,2つのソースビューで新規なビュー合成を行う新しいNeRF手法を提案する。
明瞭な対応マッチングは、異なるビュー上の3Dポイントの2次元投影でサンプリングされた画像特徴間のコサイン類似度と定量化される。
実験では,実験結果から得られたコサイン特徴の類似性と体積密度との間に強い相関関係が認められた。
論文 参考訳(メタデータ) (2023-04-24T17:46:01Z) - OAMatcher: An Overlapping Areas-based Network for Accurate Local Feature
Matching [9.006654114778073]
OAMatcherは、人間の動作を模倣して、密集した正確な一致を生成する、検知不要な手法である。
OAMatcherは重複する領域を予測し、効果的でクリーンなグローバルコンテキストアグリゲーションを促進する。
総合的な実験により、OAMatcherはいくつかのベンチマークで最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2023-02-12T03:32:45Z) - DeepMatcher: A Deep Transformer-based Network for Robust and Accurate
Local Feature Matching [9.662752427139496]
本研究では,検出器レス手法における局所的特徴マッチングの探索に基づくディープトランスフォーマーベースネットワークを提案する。
DeepMatcherは、より直感的でシンプルでマッシュアップな機能をキャプチャする。
我々は、DeepMatcherがいくつかのベンチマークで最先端の手法を大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2023-01-08T07:15:09Z) - Adaptive Assignment for Geometry Aware Local Feature Matching [22.818457285745733]
検出不要な特徴マッチングアプローチは、その優れたパフォーマンスのおかげで、現在大きな注目を集めている。
本稿では,AdaMatcherについて紹介する。AdaMatcherは特徴相関と協調可視領域推定を,精巧な特徴相互作用モジュールを通じて実現する。
次に、AdaMatcherは、画像間のスケールを推定しながらパッチレベルのマッチングに適応的な割り当てを行い、最後に、スケールアライメントとサブピクセルレグレッションモジュールを通じて、コビジブルマッチングを洗練する。
論文 参考訳(メタデータ) (2022-07-18T08:22:18Z) - TransforMatcher: Match-to-Match Attention for Semantic Correspondence [48.25709192748133]
本稿では,視覚領域におけるトランスフォーマーネットワークの成功を基盤として,TransforMatcherと呼ばれる強力なセマンティック画像マッチング学習手法を提案する。
既存の畳み込みや注意に基づく対応スキームとは異なり、TransforMatcherは、正確なマッチングローカライゼーションとダイナミックリファインメントのために、グローバルなマッチングアテンションを実行する。
実験では、TransforMatcherはSPair-71k上の新しい状態を設定し、PF-PASCALデータセット上の既存のSOTAメソッドと同等に動作させる。
論文 参考訳(メタデータ) (2022-05-23T21:02:01Z) - SIFT Matching by Context Exposed [7.99536002595393]
本稿では、マッチングコンテキスト情報を利用して、ローカル画像記述子マッチングをステップアップする方法を検討する。
新しいマッチング戦略と,それぞれにブロブマッチング(blob matching)とデラウネー三角法マッチング(Delaunay Triangulation Matching, DTM)と呼ばれる新しい局所空間フィルタが考案された。
DTMは、特に非平面シーンにおいて、精度とロバストさの整合性の観点から、最先端技術よりも同等か優れている。
論文 参考訳(メタデータ) (2021-06-17T15:10:59Z) - 3D Correspondence Grouping with Compatibility Features [51.869670613445685]
本稿では,3次元対応グルーピングのための簡易かつ効果的な手法を提案する。
目的は、局所幾何学的記述子を不整合と外接点にマッチングすることによって得られる初期対応を正確に分類することである。
本稿では,不整合と不整合を表わすために,互換性特徴(CF)と呼ばれる3次元対応の表現を提案する。
論文 参考訳(メタデータ) (2020-07-21T02:39:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。