論文の概要: Patch-wise Retrieval: A Bag of Practical Techniques for Instance-level Matching
- arxiv url: http://arxiv.org/abs/2512.12610v1
- Date: Sun, 14 Dec 2025 09:24:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-16 17:54:56.345237
- Title: Patch-wise Retrieval: A Bag of Practical Techniques for Instance-level Matching
- Title(参考訳): Patch-wise Retrieval: インスタンスレベルのマッチングのための実践的テクニックのバグ
- Authors: Wonseok Choi, Sohwi Lim, Nam Hyeon-Woo, Moon Ye-Bin, Dong-Ju Jeong, Jinyoung Hwang, Tae-Hyun Oh,
- Abstract要約: 本稿では,パッチワイド検索フレームワークであるPatchifyを提案する。
Patchifyは、各データベースイメージを少数の構造化パッチに分割し、これらのローカル機能とグローバルクエリ記述子を比較して検索を行う。
また、検索した領域が対象オブジェクトと一致しているかどうかを定量化するローカライズ対応メトリックであるLocScoreについても紹介する。
- 参考スコア(独自算出の注目度): 24.460182859244952
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Instance-level image retrieval aims to find images containing the same object as a given query, despite variations in size, position, or appearance. To address this challenging task, we propose Patchify, a simple yet effective patch-wise retrieval framework that offers high performance, scalability, and interpretability without requiring fine-tuning. Patchify divides each database image into a small number of structured patches and performs retrieval by comparing these local features with a global query descriptor, enabling accurate and spatially grounded matching. To assess not just retrieval accuracy but also spatial correctness, we introduce LocScore, a localization-aware metric that quantifies whether the retrieved region aligns with the target object. This makes LocScore a valuable diagnostic tool for understanding and improving retrieval behavior. We conduct extensive experiments across multiple benchmarks, backbones, and region selection strategies, showing that Patchify outperforms global methods and complements state-of-the-art reranking pipelines. Furthermore, we apply Product Quantization for efficient large-scale retrieval and highlight the importance of using informative features during compression, which significantly boosts performance. Project website: https://wons20k.github.io/PatchwiseRetrieval/
- Abstract(参考訳): インスタンスレベルの画像検索は、サイズ、位置、外観の違いにもかかわらず、所定のクエリと同じオブジェクトを含む画像を見つけることを目的としている。
この課題に対処するために、我々は、微調整を必要とせず、高いパフォーマンス、スケーラビリティ、解釈性を提供する、シンプルで効果的なパッチワイズ検索フレームワークであるPatchifyを提案する。
Patchifyは、各データベースイメージを少数の構造化パッチに分割し、これらのローカル特徴をグローバルなクエリ記述子と比較して検索し、正確で空間的に接地されたマッチングを可能にする。
検索精度だけでなく空間的正当性も評価するために,検索した領域が対象対象物と一致しているかどうかを定量化するローカライズ対応計量であるLocScoreを導入する。
これにより、LocScoreは検索行動を理解し改善するための貴重な診断ツールとなる。
我々は、複数のベンチマーク、バックボーン、リージョン選択戦略にわたる広範な実験を行い、Patchifyがグローバルメソッドより優れ、最先端のパイプラインを補完することを示す。
さらに,効率的な大規模検索にProduct Quantizationを適用し,圧縮時に情報的特徴を用いることの重要性を強調し,性能を著しく向上させる。
プロジェクトウェブサイト:https://wons20k.github.io/PatchwiseRetrieval/
関連論文リスト
- PFF-Net: Patch Feature Fitting for Point Cloud Normal Estimation [81.94096000733127]
点雲の頑健な正規推定のための特徴抽出の新しいアイデアを提案する。
我々は、様々なデータやジオメトリに対して適切なパッチサイズを選択する問題に対処するために、異なる近傍サイズのマルチスケール特徴の融合を利用する。
マルチスケールの特徴を集約した近似戦略により,各局所パッチのスケール適応を実現することができる。
論文 参考訳(メタデータ) (2025-11-26T13:12:14Z) - FUSELOC: Fusing Global and Local Descriptors to Disambiguate 2D-3D Matching in Visual Localization [52.57327385675752]
直接2D-3Dマッチングではメモリが大幅に削減されるが、より大きくあいまいな検索空間のために精度が低下する。
重み付き平均演算子を用いて局所的および大域的記述子を融合することにより、この曖昧さに対処する。
メモリを43%削減し、1.6倍高速に動作しながら、階層的な手法に近いパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-08-21T23:42:16Z) - Decoupled DETR: Spatially Disentangling Localization and Classification
for Improved End-to-End Object Detection [48.429555904690595]
本稿では,タスク認識型問合せ生成モジュールと切り離された特徴学習プロセスを含む空間的に分離されたDETRを紹介する。
提案手法は,従来の研究に比べてMSCOCOデータセットの大幅な改善を実現していることを示す。
論文 参考訳(メタデータ) (2023-10-24T15:54:11Z) - LoCUS: Learning Multiscale 3D-consistent Features from Posed Images [18.648772607057175]
我々は、監督なしに多目的な神経表現を訓練する。
検索セットを慎重に構築することで、検索と再利用のバランスをとることができる。
スパース,マルチスケール,セマンティック空間マップの作成結果を示す。
論文 参考訳(メタデータ) (2023-10-02T11:11:23Z) - Are Local Features All You Need for Cross-Domain Visual Place
Recognition? [13.519413608607781]
視覚的位置認識は、視覚的手がかりのみに基づいて画像の座標を予測することを目的としている。
近年の進歩にもかかわらず、クエリがかなり異なる分布から来るのと同じ場所を認識することは、依然として最先端の検索手法にとって大きなハードルである。
本研究では,空間的検証に基づく手法がこれらの課題に対処できるかどうかを考察する。
論文 参考訳(メタデータ) (2023-04-12T14:46:57Z) - ComplETR: Reducing the cost of annotations for object detection in dense
scenes with vision transformers [73.29057814695459]
ComplETRは、部分的にアノテートされた高密度なシーンデータセットで欠落したアノテーションを明示的に補完するように設計されている。
これにより、シーン内のすべてのオブジェクトインスタンスに注釈を付ける必要がなくなり、アノテーションのコストが削減される。
本稿では, 高速R-CNN, カスケードR-CNN, CenterNet2, Deformable DETRなどの人気検出器の性能向上を示す。
論文 参考訳(メタデータ) (2022-09-13T00:11:16Z) - Investigating the Role of Image Retrieval for Visual Localization -- An
exhaustive benchmark [46.166955777187816]
本稿では,複数の視覚的ローカライゼーションパラダイムにおける画像検索の役割を理解することに焦点を当てる。
本稿では、新しいベンチマーク設定を導入し、複数のデータセットにおける最先端の検索表現を比較した。
これらのツールと奥行き分析を用いて、古典的ランドマーク検索や位置認識タスクにおける検索性能は、ローカライズ性能に限らず、すべてのパラダイムで相関していることを示す。
論文 参考訳(メタデータ) (2022-05-31T12:59:01Z) - Sparse Instance Activation for Real-Time Instance Segmentation [72.23597664935684]
本稿では,リアルタイムインスタンスセグメンテーションのための概念的・効率的・完全畳み込み型フレームワークを提案する。
SparseInstは非常に高速な推論速度を持ち、COCOベンチマークで40 FPSと37.9 APを達成した。
論文 参考訳(メタデータ) (2022-03-24T03:15:39Z) - Towards Accurate Localization by Instance Search [2.0539994999823334]
自己評価学習フレームワークが提案され、インスタンス検索によって返されるランクリストの精度の高いオブジェクトローカライゼーションを実現する。
提案フレームワークは,クエリと対応するトップランク検索結果から,ターゲットインスタンスを徐々にマイニングする。
インスタンス検索におけるローカライゼーションの実行に加えて、数発のオブジェクト検出の問題は、同じフレームワークの下でも対処される。
論文 参考訳(メタデータ) (2021-07-11T10:03:31Z) - Graph Sampling Based Deep Metric Learning for Generalizable Person
Re-Identification [114.56752624945142]
我々は、最も一般的なランダムサンプリング手法である有名なpkサンプリングは、深層メトリック学習にとって有益で効率的ではないと主張する。
大規模計量学習のためのグラフサンプリング(GS)と呼ばれる効率的なミニバッチサンプリング手法を提案する。
論文 参考訳(メタデータ) (2021-04-04T06:44:15Z) - Benchmarking Image Retrieval for Visual Localization [41.38065116577011]
視覚的ローカライゼーションは、自律運転や拡張現実といったテクノロジーの中核的なコンポーネントである。
これらのタスクには最先端の画像検索アルゴリズムを用いるのが一般的である。
本稿では,複数の視覚的ローカライゼーションタスクにおける画像検索の役割を理解することに焦点を当てる。
論文 参考訳(メタデータ) (2020-11-24T07:59:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。