論文の概要: SGAD: Semantic and Geometric-aware Descriptor for Local Feature Matching
- arxiv url: http://arxiv.org/abs/2508.02278v1
- Date: Mon, 04 Aug 2025 10:46:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:22.295693
- Title: SGAD: Semantic and Geometric-aware Descriptor for Local Feature Matching
- Title(参考訳): SGAD: 局所特徴マッチングのための意味的および幾何学的認識記述子
- Authors: Xiangzeng Liu, Chi Wang, Guanglu Shi, Xiaodong Zhang, Qiguang Miao, Miao Fan,
- Abstract要約: 本稿では,領域ベースのマッチングを根本的に再考するSemantic and Geometric-aware Descriptor Network (SGAD)を紹介する。
SGADは、複雑なグラフの最適化なしに直接マッチングを可能にする、高度に識別可能な領域記述子を生成する。
我々は、領域マッチングタスクを分類とランク付けサブタスクに分解する新しい監督戦略により、領域マッチングの性能をさらに改善する。
- 参考スコア(独自算出の注目度): 16.683203139962153
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Local feature matching remains a fundamental challenge in computer vision. Recent Area to Point Matching (A2PM) methods have improved matching accuracy. However, existing research based on this framework relies on inefficient pixel-level comparisons and complex graph matching that limit scalability. In this work, we introduce the Semantic and Geometric-aware Descriptor Network (SGAD), which fundamentally rethinks area-based matching by generating highly discriminative area descriptors that enable direct matching without complex graph optimization. This approach significantly improves both accuracy and efficiency of area matching. We further improve the performance of area matching through a novel supervision strategy that decomposes the area matching task into classification and ranking subtasks. Finally, we introduce the Hierarchical Containment Redundancy Filter (HCRF) to eliminate overlapping areas by analyzing containment graphs. SGAD demonstrates remarkable performance gains, reducing runtime by 60x (0.82s vs. 60.23s) compared to MESA. Extensive evaluations show consistent improvements across multiple point matchers: SGAD+LoFTR reduces runtime compared to DKM, while achieving higher accuracy (0.82s vs. 1.51s, 65.98 vs. 61.11) in outdoor pose estimation, and SGAD+ROMA delivers +7.39% AUC@5{\deg} in indoor pose estimation, establishing a new state-of-the-art.
- Abstract(参考訳): 局所的な特徴マッチングはコンピュータビジョンにおける根本的な課題である。
近年のA2PM法ではマッチング精度が向上している。
しかし、この枠組みに基づく既存の研究は、スケーラビリティを制限する非効率なピクセルレベルの比較と複雑なグラフマッチングに依存している。
本研究では,SGAD(Semantic and Geometric-Aware Descriptor Network)を導入し,複雑なグラフ最適化を伴わずに直接マッチングが可能な高度に識別可能な領域記述子を生成することにより,領域ベースのマッチングを根本的に再考する。
このアプローチは、領域マッチングの精度と効率の両方を著しく改善する。
我々は、領域マッチングタスクを分類とランク付けサブタスクに分解する新しい監督戦略により、領域マッチングの性能をさらに改善する。
最後に,階層型Containment Redundancy Filter (HCRF)を導入し,包摂グラフを解析して重複領域を除去する。
SGADは、MESAと比較して、ランタイムを60倍(0.82s vs. 60.23s)削減している。
SGAD+LoFTRはDKMと比較してランタイムを削減し、屋外のポーズ推定では高い精度(0.82s vs. 1.51s, 65.98 vs. 61.11)、屋内ポーズ推定ではSGAD+ROMAが+7.39%のAUC@5{\deg}を配信し、新しい最先端技術を確立した。
関連論文リスト
- Enhancing point cloud analysis via neighbor aggregation correction based on cross-stage structure correlation [22.48120946682699]
ポイントクラウド分析は、ポイントクラウドデータの理解の基礎となるローカル構造を集約する多くの下流タスクの基盤となる。
本稿では,高次元空間における相関を利用してアグリゲーション中の特徴分布を補正する点分布集合抽象モジュール(PDSA)を提案する。
PDSAは、軽量なクロスステージ構造記述子に基づいて点相関を区別し、構造的均一性を高める。
論文 参考訳(メタデータ) (2025-06-18T06:08:17Z) - MESA: Effective Matching Redundancy Reduction by Semantic Area Segmentation [22.288675638485618]
本稿では,新しい特徴マッチング手法としてMESAとDMESAを提案する。
MESAはSAMの高度な画像理解に基づいて、点マッチングの前に暗黙のセマンティック領域マッチングを確立する。
繰り返し計算が少ないため、DMESAはMESAと比較して約5倍の速度向上を示す。
論文 参考訳(メタデータ) (2024-08-01T04:39:36Z) - AffineGlue: Joint Matching and Robust Estimation [74.04609046690913]
AffineGlue, 連立2視点特徴マッチングとロバストな推定法を提案する。
AffineGlueは、最小限のモデルを推定するために、1対多の対応から潜在的なマッチを選択する。
ガイドマッチングはモデルと一致した一致を見つけるために使用され、1対1の一致の曖昧さに悩まされる。
論文 参考訳(メタデータ) (2023-07-28T08:05:36Z) - Searching from Area to Point: A Hierarchical Framework for Semantic-Geometric Combined Feature Matching [16.16319526547664]
我々は,特徴的意味領域マッチングを含むマッチング画像領域として,点マッチングの初期探索空間を設定した。
この検索空間は、有意な特徴による点マッチングを好んでおり、最近のTransformerベースのマッチング手法の精度制限を緩和している。
本稿では、画像間のセマンティックな領域マッチングを最初に見つけるために、A2PM(Area to Point Matching)という階層的な特徴マッチングフレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-29T08:16:12Z) - Adaptive Spot-Guided Transformer for Consistent Local Feature Matching [64.30749838423922]
局所的特徴マッチングのための適応スポットガイド変換器(ASTR)を提案する。
ASTRは、統一された粗いアーキテクチャにおける局所的な一貫性とスケールのバリエーションをモデル化する。
論文 参考訳(メタデータ) (2023-03-29T12:28:01Z) - Federated Minimax Optimization: Improved Convergence Analyses and
Algorithms [32.062312674333775]
我々は、最小限の最適化を考慮し、GANのようなモダンな機械学習アプリケーションの多くを普及させています。
我々は,既存の文献における収束通信の保証を改善する,新しい,より厳密な解析アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-03-09T16:21:31Z) - Guide Local Feature Matching by Overlap Estimation [9.387323456222823]
OETRというTRansformerを用いた画像ペア上でのオーバーラップ推定手法を提案する。
OETRは、特徴相関の2段階のプロセスで重なり推定を行い、次いで重なり回帰を行う。
実験の結果,OETRは局所的特徴マッチング性能を大幅に向上させることができることがわかった。
論文 参考訳(メタデータ) (2022-02-18T07:11:36Z) - Escaping Saddle Points with Bias-Variance Reduced Local Perturbed SGD
for Communication Efficient Nonconvex Distributed Learning [58.79085525115987]
ローカル手法は通信時間を短縮する有望なアプローチの1つである。
局所的データセットが局所的損失の滑らかさよりも小さい場合,通信の複雑さは非局所的手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-02-12T15:12:17Z) - ZARTS: On Zero-order Optimization for Neural Architecture Search [94.41017048659664]
微分可能なアーキテクチャサーチ (DARTS) は、NASの高効率性のため、一般的なワンショットパラダイムである。
この作業はゼロオーダーの最適化に変わり、上記の近似を強制せずに探索するための新しいNASスキームであるZARTSを提案する。
特に、12ベンチマークの結果は、DARTSの性能が低下するZARTSの顕著な堅牢性を検証する。
論文 参考訳(メタデータ) (2021-10-10T09:35:15Z) - Higher Performance Visual Tracking with Dual-Modal Localization [106.91097443275035]
Visual Object Tracking (VOT)は、堅牢性と正確性の両方に同期性を必要とする。
ONRによるロバストなローカリゼーション抑制器とOFCによるターゲットセンターへの正確なローカリゼーションにより、ターゲットローカリゼーションのためのデュアルモーダルフレームワークを提案します。
論文 参考訳(メタデータ) (2021-03-18T08:47:56Z) - Making Affine Correspondences Work in Camera Geometry Computation [62.7633180470428]
局所的な特徴は、ポイント・ツー・ポイント対応ではなく、リージョン・ツー・リージョンを提供する。
本稿では,全モデル推定パイプラインにおいて,地域間マッチングを効果的に活用するためのガイドラインを提案する。
実験により、アフィンソルバはより高速な実行時にポイントベースソルバに匹敵する精度を達成できることが示された。
論文 参考訳(メタデータ) (2020-07-20T12:07:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。