論文の概要: Learning to Guide Local Feature Matches
- arxiv url: http://arxiv.org/abs/2010.10959v1
- Date: Wed, 21 Oct 2020 12:53:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 00:27:32.238404
- Title: Learning to Guide Local Feature Matches
- Title(参考訳): ローカルな特徴マッチングをガイドする学習
- Authors: Fran\c{c}ois Darmon and Mathieu Aubry and Pascal Monasse
- Abstract要約: 本稿では,局所特徴マッチングを学習した近似画像マッチングを用いてガイドする学習ベースアプローチを提案する。
我々の手法はSIFTの結果を最先端のDeep Descriptorに類似したレベルに引き上げることができる。
- 参考スコア(独自算出の注目度): 19.268062255064397
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We tackle the problem of finding accurate and robust keypoint correspondences
between images. We propose a learning-based approach to guide local feature
matches via a learned approximate image matching. Our approach can boost the
results of SIFT to a level similar to state-of-the-art deep descriptors, such
as Superpoint, ContextDesc, or D2-Net and can improve performance for these
descriptors. We introduce and study different levels of supervision to learn
coarse correspondences. In particular, we show that weak supervision from
epipolar geometry leads to performances higher than the stronger but more
biased point level supervision and is a clear improvement over weak image level
supervision. We demonstrate the benefits of our approach in a variety of
conditions by evaluating our guided keypoint correspondences for localization
of internet images on the YFCC100M dataset and indoor images on theSUN3D
dataset, for robust localization on the Aachen day-night benchmark and for 3D
reconstruction in challenging conditions using the LTLL historical image data.
- Abstract(参考訳): 画像間の高精度で堅牢なキーポイント対応を見つける問題に取り組む。
本稿では,局所特徴マッチングを学習した近似画像マッチングを用いてガイドする学習手法を提案する。
我々の手法はSIFTの結果をSuperpointやContextDesc、D2-Netといった最先端のDeep Descriptorに類似したレベルに引き上げることができ、これらのDescriptorの性能を向上させることができる。
我々は、粗い対応を学ぶために異なるレベルの監督を導入し、研究する。
特に、エピポーラ幾何学からの弱い監督は、より強いが偏りのある点レベルの監督よりも高い性能をもたらすことが示され、画像レベルの監督よりも明らかに改善されている。
我々は,YFCC100Mデータセット上のインターネット画像のローカライズとSUN3Dデータセット上の屋内画像のローカライズ,Aachenday-nightベンチマークでのロバストなローカライズ,LTLL履歴画像データを用いた挑戦的な状況における3次元再構成について,この手法の利点を様々な条件で示す。
関連論文リスト
- Pic@Point: Cross-Modal Learning by Local and Global Point-Picture Correspondence [0.0]
構造的2D-3D対応に基づく効果的なコントラスト学習手法であるPic@Pointを提案する。
我々は,意味的および文脈的知識に富んだイメージキューを活用して,ポイントクラウド表現のガイド信号を提供する。
論文 参考訳(メタデータ) (2024-10-12T12:43:41Z) - Self-supervised Learning of Dense Hierarchical Representations for Medical Image Segmentation [2.2265038612930663]
本稿では,高密度下流タスクに適したボクセルワイド粗い表現を学習するための自己教師型フレームワークについて述べる。
我々は、複数のスケールから機能のコントリビューションのバランスをとるためのトレーニング戦略を考案し、学習された表現が粗い詳細ときめ細かい詳細の両方を捉えることを保証する。
論文 参考訳(メタデータ) (2024-01-12T09:47:17Z) - Towards Better Gradient Consistency for Neural Signed Distance Functions
via Level Set Alignment [50.892158511845466]
レベルセットの並列性によって示される場の勾配一貫性が、推論精度に影響を及ぼす重要な要因であることを示す。
そこで本研究では,次数集合の並列性を評価するためのレベルセットアライメント損失を提案する。
論文 参考訳(メタデータ) (2023-05-19T11:28:05Z) - CSP: Self-Supervised Contrastive Spatial Pre-Training for
Geospatial-Visual Representations [90.50864830038202]
ジオタグ付き画像の自己教師型学習フレームワークであるContrastive Spatial Pre-Training(CSP)を提案する。
デュアルエンコーダを用いて画像とその対応する位置情報を別々に符号化し、コントラスト目的を用いて画像から効果的な位置表現を学習する。
CSPは、様々なラベル付きトレーニングデータサンプリング比と10~34%の相対的な改善で、モデル性能を大幅に向上させる。
論文 参考訳(メタデータ) (2023-05-01T23:11:18Z) - De-coupling and De-positioning Dense Self-supervised Learning [65.56679416475943]
Dense Self-Supervised Learning (SSL)メソッドは、複数のオブジェクトでイメージを処理する際に、画像レベルの特徴表現を使用する際の制限に対処する。
本研究は, 層深度やゼロパディングに伴う受容野の増大によって生じる, 結合と位置バイアスに悩まされていることを示す。
我々はCOCOにおける本手法の利点と、オブジェクト分類、セマンティックセグメンテーション、オブジェクト検出のための新しい挑戦的ベンチマークであるOpenImage-MINIについて示す。
論文 参考訳(メタデータ) (2023-03-29T18:07:25Z) - Pixel-level Correspondence for Self-Supervised Learning from Video [56.24439897867531]
ピクセルレベルの対応 (PiCo) はビデオから高密度なコントラスト学習を行う方法である。
標準的なベンチマークでPiCoを検証し、複数の高密度予測タスクで自己教師付きベースラインを上回ります。
論文 参考訳(メタデータ) (2022-07-08T12:50:13Z) - DenseGAP: Graph-Structured Dense Correspondence Learning with Anchor
Points [15.953570826460869]
2つの画像間の密接な対応を確立することは、基本的なコンピュータビジョンの問題である。
我々は、アンカーポイントに条件付きグラフ構造化ニューラルネットワークを用いたDense対応学習のための新しいソリューションであるDenseGAPを紹介する。
提案手法は,ほとんどのベンチマークにおいて対応学習の最先端化を図っている。
論文 参考訳(メタデータ) (2021-12-13T18:59:30Z) - MAF: Multimodal Alignment Framework for Weakly-Supervised Phrase
Grounding [74.33171794972688]
本稿では,詳細な視覚表現と視覚認識言語表現を活用することで,句オブジェクトの関連性をモデル化するアルゴリズムを提案する。
広く採用されているFlickr30kデータセットで実施された実験は、既存の弱教師付き手法よりも大幅に改善されている。
論文 参考訳(メタデータ) (2020-10-12T00:43:52Z) - Co-Attention for Conditioned Image Matching [91.43244337264454]
照明, 視点, コンテキスト, 素材に大きな変化がある場合, 野生のイメージペア間の対応性を決定するための新しい手法を提案する。
他のアプローチでは、イメージを個別に扱うことで、画像間の対応を見出すが、その代わりに、画像間の差異を暗黙的に考慮するよう、両画像に条件を付ける。
論文 参考訳(メタデータ) (2020-07-16T17:32:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。