論文の概要: Generalized Correspondence Matching via Flexible Hierarchical Refinement
and Patch Descriptor Distillation
- arxiv url: http://arxiv.org/abs/2403.05388v1
- Date: Fri, 8 Mar 2024 15:32:18 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-11 13:15:55.462277
- Title: Generalized Correspondence Matching via Flexible Hierarchical Refinement
and Patch Descriptor Distillation
- Title(参考訳): フレキシブル階層化とパッチ記述子蒸留による一般対応マッチング
- Authors: Yu Han, Ziwei Long, Yanting Zhang, Jin Wu, Zhijun Fang and Rui Fan
- Abstract要約: 対応マッチングは多くのロボティクス応用において重要な役割を担っている。
本稿では,SoTA (State-of-the-art) のプラグ・アンド・プレイ対応手法であるDFM (Deep Feature Match) の限界に対処する。
提案手法は,それぞれ1,3,5画素に対する平均マッチング精度0.68,0.92,0.95の総合的な性能を実現する。
- 参考スコア(独自算出の注目度): 13.802788788420175
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Correspondence matching plays a crucial role in numerous robotics
applications. In comparison to conventional hand-crafted methods and recent
data-driven approaches, there is significant interest in plug-and-play
algorithms that make full use of pre-trained backbone networks for multi-scale
feature extraction and leverage hierarchical refinement strategies to generate
matched correspondences. The primary focus of this paper is to address the
limitations of deep feature matching (DFM), a state-of-the-art (SoTA)
plug-and-play correspondence matching approach. First, we eliminate the
pre-defined threshold employed in the hierarchical refinement process of DFM by
leveraging a more flexible nearest neighbor search strategy, thereby preventing
the exclusion of repetitive yet valid matches during the early stages. Our
second technical contribution is the integration of a patch descriptor, which
extends the applicability of DFM to accommodate a wide range of backbone
networks pre-trained across diverse computer vision tasks, including image
classification, semantic segmentation, and stereo matching. Taking into account
the practical applicability of our method in real-world robotics applications,
we also propose a novel patch descriptor distillation strategy to further
reduce the computational complexity of correspondence matching. Extensive
experiments conducted on three public datasets demonstrate the superior
performance of our proposed method. Specifically, it achieves an overall
performance in terms of mean matching accuracy of 0.68, 0.92, and 0.95 with
respect to the tolerances of 1, 3, and 5 pixels, respectively, on the HPatches
dataset, outperforming all other SoTA algorithms. Our source code, demo video,
and supplement are publicly available at mias.group/GCM.
- Abstract(参考訳): 対応マッチングは多くのロボティクス応用において重要な役割を果たす。
従来の手作り手法や最近のデータ駆動手法と比較して、マルチスケールの特徴抽出に事前学習されたバックボーンネットワークをフル活用し、階層的洗練戦略を利用して一致した対応を生成するプラグイン・アンド・プレイアルゴリズムに大きな関心がある。
本稿では,DFM(Deep-of-the-art(SoTA)プラグイン・アンド・プレイ対応マッチング手法)の限界に対処することを目的とする。
まず,よりフレキシブルな近辺探索戦略を活用し,dfmの階層的改良プロセスで用いられる予め定義されたしきい値を排除することにより,初期段階における反復的かつ有効なマッチングの排除を図る。
第2の技術的貢献は、画像分類、セマンティックセグメンテーション、ステレオマッチングを含む様々なコンピュータビジョンタスクで事前訓練された幅広いバックボーンネットワークに対応するために、DFMの適用性を拡張するパッチ記述子の統合である。
実世界のロボティクス応用における本手法の実用性を考慮して,マッチングマッチングの計算複雑性をさらに軽減するための新しいパッチ記述子蒸留法を提案する。
3つの公開データセットに対して行った大規模な実験は,提案手法の優れた性能を示す。
具体的には,HPatchesデータセット上の1,3,5ピクセルに対する平均マッチング精度0.68,0.92,0.95の総合的な性能を達成し,他のSoTAアルゴリズムよりも優れていた。
ソースコード、デモビデオ、サプリメントはmias.group/gcmで公開されている。
関連論文リスト
- Efficient Network Embedding by Approximate Equitable Partitions [0.15978270011184256]
等価パーティションの近似変分に基づく簡便で効率的な埋め込み手法を提案する。
マルコフ連鎖の等間隔分割と同値関係と常微分方程式の関係を利用して分割精算アルゴリズムを開発する。
ビジュアライゼーション、分類、レグレッションのタスクにおいて、1~3桁のコストで同等のパフォーマンスを報告します。
論文 参考訳(メタデータ) (2024-09-16T10:51:24Z) - Fully Differentiable Correlation-driven 2D/3D Registration for X-ray to CT Image Fusion [3.868072865207522]
画像ベース剛性2D/3Dレジストレーションは, 蛍光ガイド下外科手術において重要な技術である。
デュアルブランチCNN変換器エンコーダを用いた完全微分型相関型ネットワークを提案する。
組込み情報に基づく低周波特徴と高周波特徴の分解に対して相関型損失を提案する。
論文 参考訳(メタデータ) (2024-02-04T14:12:51Z) - Feature Decoupling-Recycling Network for Fast Interactive Segmentation [79.22497777645806]
近年のインタラクティブセグメンテーション手法では,入力としてソースイメージ,ユーザガイダンス,従来予測されていたマスクを反復的に取り込んでいる。
本稿では,本質的な相違点に基づいてモデリングコンポーネントを分離するFDRN(Feature Decoupling-Recycling Network)を提案する。
論文 参考訳(メタデータ) (2023-08-07T12:26:34Z) - Object Segmentation by Mining Cross-Modal Semantics [68.88086621181628]
マルチモーダル特徴の融合と復号を導くために,クロスモーダル・セマンティックスをマイニングする手法を提案する。
具体的には,(1)全周減衰核融合(AF),(2)粗大デコーダ(CFD),(3)多層自己超越からなる新しいネットワークXMSNetを提案する。
論文 参考訳(メタデータ) (2023-05-17T14:30:11Z) - AdaStereo: An Efficient Domain-Adaptive Stereo Matching Approach [50.855679274530615]
本稿では,AdaStereoというドメイン適応型アプローチを提案する。
我々のモデルは、KITTI、Middlebury、ETH3D、DrivingStereoなど、複数のベンチマークで最先端のクロスドメイン性能を実現している。
提案手法は,様々なドメイン適応設定に対して堅牢であり,迅速な適応アプリケーションシナリオや実環境展開に容易に組み込むことができる。
論文 参考訳(メタデータ) (2021-12-09T15:10:47Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Manifold Regularized Dynamic Network Pruning [102.24146031250034]
本稿では,全インスタンスの多様体情報をプルーンドネットワークの空間に埋め込むことにより,冗長フィルタを動的に除去する新しいパラダイムを提案する。
提案手法の有効性をいくつかのベンチマークで検証し,精度と計算コストの両面で優れた性能を示す。
論文 参考訳(メタデータ) (2021-03-10T03:59:03Z) - Decoupled and Memory-Reinforced Networks: Towards Effective Feature
Learning for One-Step Person Search [65.51181219410763]
歩行者検出と識別サブタスクを1つのネットワークで処理するワンステップ方式を開発しました。
現在のワンステップアプローチには2つの大きな課題があります。
本稿では,これらの問題を解決するために,分離メモリ強化ネットワーク(DMRNet)を提案する。
論文 参考訳(メタデータ) (2021-02-22T06:19:45Z) - HDD-Net: Hybrid Detector Descriptor with Mutual Interactive Learning [24.13425816781179]
局所的特徴抽出は、SLAMや3D再構成、ARアプリケーションといった分野の進歩により、現在も活発な研究領域である。
両抽出を個別に処理し,学習過程における相互作用に焦点を当てる手法を提案する。
我々は,カメラのローカライゼーション作業に匹敵せず,HPatchの画像マッチングと3次元再構成品質の観点から,技術状況の改善を示す。
論文 参考訳(メタデータ) (2020-05-12T13:55:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。