論文の概要: $A^2$GC: $A$symmetric $A$ggregation with Geometric Constraints for Locally Aggregated Descriptors
- arxiv url: http://arxiv.org/abs/2511.14109v1
- Date: Tue, 18 Nov 2025 03:47:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-19 16:23:52.918245
- Title: $A^2$GC: $A$symmetric $A$ggregation with Geometric Constraints for Locally Aggregated Descriptors
- Title(参考訳): A^2$GC:$A$symmetric $A$ggregation with Geometric Constraints for Locally Aggregated Descriptors
- Authors: Zhenyu Li, Tianyi Shang,
- Abstract要約: 本稿では,局所的に集約された記述子に対する幾何学的制約を持つ非対称アグリゲーションVPR法($A2$GC-VPR)を提案する。
視覚的位置認識における分布の相違に適応する非対称なマッチングを可能にする。
- 参考スコア(独自算出の注目度): 6.392844932864485
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Visual Place Recognition (VPR) aims to match query images against a database using visual cues. State-of-the-art methods aggregate features from deep backbones to form global descriptors. Optimal transport-based aggregation methods reformulate feature-to-cluster assignment as a transport problem, but the standard Sinkhorn algorithm symmetrically treats source and target marginals, limiting effectiveness when image features and cluster centers exhibit substantially different distributions. We propose an asymmetric aggregation VPR method with geometric constraints for locally aggregated descriptors, called $A^2$GC-VPR. Our method employs row-column normalization averaging with separate marginal calibration, enabling asymmetric matching that adapts to distributional discrepancies in visual place recognition. Geometric constraints are incorporated through learnable coordinate embeddings, computing compatibility scores fused with feature similarities, thereby promoting spatially proximal features to the same cluster and enhancing spatial awareness. Experimental results on MSLS, NordLand, and Pittsburgh datasets demonstrate superior performance, validating the effectiveness of our approach in improving matching accuracy and robustness.
- Abstract(参考訳): ビジュアルプレース認識(VPR)は、クエリ画像をビジュアルキューを使用してデータベースとマッチングすることを目的としている。
State-of-the-artメソッドは、深いバックボーンから機能を集約してグローバルな記述子を形成する。
しかし,Sinkhornアルゴリズムでは,画像特徴とクラスタ中心がほぼ異なる分布を示す場合の有効性を制限し,ソースとターゲットの辺縁を対称的に扱う。
A^2$GC-VPRと呼ばれる局所的に集約された記述子に対する幾何学的制約を持つ非対称アグリゲーションVPR法を提案する。
視覚的位置認識における分布の相違に適応する非対称なマッチングを可能にする。
幾何学的制約は、学習可能な座標埋め込みによって組み込まれ、特徴的類似性に融合した計算互換性スコアは、同じクラスタに空間的近位性を促進し、空間的認識を高める。
MSLS, NordLand, ピッツバーグのデータセットに対する実験結果から, マッチング精度とロバスト性を改善するためのアプローチの有効性が検証された。
関連論文リスト
- Hypernetwork-based approach for grid-independent functional data clustering [3.142113135607563]
本稿では,離散化関数の観測結果を,自動符号化アーキテクチャを用いて固定次元ベクトル空間にマッピングするフレームワークを提案する。
エンコーダは、座標値対を暗黙の神経表現の重み空間にマッピングするハイパーネットワークである。
高次元環境下での合成および実世界の実験により,競合クラスタリング性能を実証した。
論文 参考訳(メタデータ) (2026-02-26T10:05:07Z) - Kernel Alignment-based Multi-view Unsupervised Feature Selection with Sample-level Adaptive Graph Learning [23.32756750343138]
我々は,これらの問題に対処するために,サンプルレベル適応グラフ lEarning 法 (KAFUSE) を用いたカーネルアライメントに基づくマルチビュー非教師付きFeatUre選択を提案する。
実際のマルチビューデータセットの実験は、最先端の手法よりもKAFUSEの方が優れていることを示している。
論文 参考訳(メタデータ) (2026-01-12T07:50:51Z) - CSMCIR: CoT-Enhanced Symmetric Alignment with Memory Bank for Composed Image Retrieval [54.15776146365823]
Composed Image Retrieval (CIR)では、ユーザーは参照画像と操作テキストの両方を使用してターゲットイメージを検索できる。
CSMCIRは3つの相乗的コンポーネントを通して効率的なクエリターゲットアライメントを実現する統一表現フレームワークである。
論文 参考訳(メタデータ) (2026-01-07T09:21:38Z) - Robust Scene Coordinate Regression via Geometrically-Consistent Global Descriptors [52.57327385675752]
幾何学的構造と視覚的類似性の両方に整合したグローバルな記述子を学習するアグリゲータモジュールを提案する。
これにより、信頼できないオーバーラップスコアによる誤関連が修正される。
挑戦的なベンチマークの実験では、大規模環境ではかなりのローカライゼーションが得られた。
論文 参考訳(メタデータ) (2025-12-19T04:24:03Z) - Cluster-Aware Similarity Diffusion for Instance Retrieval [64.40171728912702]
拡散に基づく再ランク付け(diffusion-based re-level)は、隣り合うグラフで類似性の伝播を実行することで、インスタンスを検索する一般的な方法である。
本稿では,新しいクラスタ・アウェア類似性(CAS)拡散モデルを提案する。
論文 参考訳(メタデータ) (2024-06-04T14:19:50Z) - MeanCut: A Greedy-Optimized Graph Clustering via Path-based Similarity
and Degree Descent Criterion [0.6906005491572401]
スペクトルクラスタリングは、優れたパフォーマンス、簡単な実装、強力な適応性のために人気があり、魅力的です。
我々は,MeanCutを目的関数として提案し,非破壊グラフ分割の次数降下順で厳密に最適化する。
本アルゴリズムの有効性は,実世界のベンチマークによる検証と顔認識の適用によって実証される。
論文 参考訳(メタデータ) (2023-12-07T06:19:39Z) - Efficient Bilateral Cross-Modality Cluster Matching for Unsupervised Visible-Infrared Person ReID [56.573905143954015]
本稿では, クラスタ間マッチングによるモダリティギャップを低減するための, クラスタマッチングに基づく新たな学習フレームワークを提案する。
このような監視信号の下では、クラスタレベルで特徴を協調的に整列させるために、モダリティ・特定・モダリティ・非依存(MSMA)コントラスト学習フレームワークが提案されている。
公開SYSU-MM01とRegDBデータセットの実験により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2023-05-22T03:27:46Z) - A One-shot Framework for Distributed Clustered Learning in Heterogeneous
Environments [54.172993875654015]
異種環境における分散学習のためのコミュニケーション効率化手法のファミリーを提案する。
ユーザによるローカル計算に基づくワンショットアプローチと、サーバにおけるクラスタリングベースのアグリゲーションステップは、強力な学習保証を提供する。
厳密な凸問題に対しては,ユーザ毎のデータ点数がしきい値を超える限り,提案手法はサンプルサイズの観点から順序最適平均二乗誤差率を達成する。
論文 参考訳(メタデータ) (2022-09-22T09:04:10Z) - Skew-Symmetric Adjacency Matrices for Clustering Directed Graphs [5.301300942803395]
カットベースの有向グラフ(グラフ)クラスタリングは、しばしばクラスタ内あるいはクラスタ間の疎結合を見つけることに焦点を当てる。
フローベースのクラスタリングでは、クラスタ間のエッジは一方向を向く傾向にあり、マイグレーションデータ、フードウェブ、トレーディングデータに見出されている。
論文 参考訳(メタデータ) (2022-03-02T20:07:04Z) - Making Affine Correspondences Work in Camera Geometry Computation [62.7633180470428]
局所的な特徴は、ポイント・ツー・ポイント対応ではなく、リージョン・ツー・リージョンを提供する。
本稿では,全モデル推定パイプラインにおいて,地域間マッチングを効果的に活用するためのガイドラインを提案する。
実験により、アフィンソルバはより高速な実行時にポイントベースソルバに匹敵する精度を達成できることが示された。
論文 参考訳(メタデータ) (2020-07-20T12:07:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。