論文の概要: Geometrically Mappable Image Features
- arxiv url: http://arxiv.org/abs/2003.09682v1
- Date: Sat, 21 Mar 2020 15:36:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-21 13:07:06.915038
- Title: Geometrically Mappable Image Features
- Title(参考訳): 幾何学的マッピング可能な画像特徴
- Authors: Janine Thoma, Danda Pani Paudel, Ajad Chhatkuli, Luc Van Gool
- Abstract要約: 地図内のエージェントの視覚に基づくローカライゼーションは、ロボット工学とコンピュータビジョンにおいて重要な問題である。
本稿では,画像検索を対象とした画像特徴学習手法を提案する。
- 参考スコア(独自算出の注目度): 85.81073893916414
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Vision-based localization of an agent in a map is an important problem in
robotics and computer vision. In that context, localization by learning
matchable image features is gaining popularity due to recent advances in
machine learning. Features that uniquely describe the visual contents of images
have a wide range of applications, including image retrieval and understanding.
In this work, we propose a method that learns image features targeted for
image-retrieval-based localization. Retrieval-based localization has several
benefits, such as easy maintenance and quick computation. However, the
state-of-the-art features only provide visual similarity scores which do not
explicitly reveal the geometric distance between query and retrieved images.
Knowing this distance is highly desirable for accurate localization, especially
when the reference images are sparsely distributed in the scene. Therefore, we
propose a novel loss function for learning image features which are both
visually representative and geometrically relatable. This is achieved by
guiding the learning process such that the feature and geometric distances
between images are directly proportional. In our experiments we show that our
features not only offer significantly better localization accuracy, but also
allow to estimate the trajectory of a query sequence in absence of the
reference images.
- Abstract(参考訳): 地図内のエージェントの視覚に基づくローカライゼーションは、ロボット工学とコンピュータビジョンにおいて重要な問題である。
その文脈では、機械学習の最近の進歩により、マッチング可能な画像特徴の学習によるローカライズが人気を集めている。
画像の視覚的な内容を記述する機能には、画像の検索や理解など、幅広い応用がある。
本研究では,画像検索を対象とした画像特徴学習手法を提案する。
検索ベースのローカライゼーションには,メンテナンスや迅速な計算など,いくつかのメリットがある。
しかし、最先端の特徴は、クエリと検索画像間の幾何学的距離を明確に示さない視覚的類似度スコアのみを提供する。
この距離を知ることは、特に参照画像がシーン内でばらばらに分布している場合に、正確なローカライズに非常に望ましい。
そこで本稿では,視覚的に代表的かつ幾何学的に対応可能な画像特徴を学習するための新しい損失関数を提案する。
これは、画像間の特徴と幾何学的距離が直接比例するように学習過程を導くことで達成される。
実験では,我々の特徴は位置推定精度が大幅に向上するだけでなく,参照画像がない場合のクエリシーケンスの軌跡を推定できることを示した。
関連論文リスト
- Breaking the Frame: Visual Place Recognition by Overlap Prediction [53.17564423756082]
本稿では,重なり合う予測に基づく新しい視覚的位置認識手法 VOP を提案する。
VOPは、Vision Transformerのバックボーンを使用してパッチレベルの埋め込みを取得することで、コビジュアブルなイメージセクションを進める。
提案手法では,データベース画像の重複点の評価に投票機構を用いる。
論文 参考訳(メタデータ) (2024-06-23T20:00:20Z) - CricaVPR: Cross-image Correlation-aware Representation Learning for Visual Place Recognition [73.51329037954866]
視覚的位置認識のための画像間相関認識を用いたロバストなグローバル表現手法を提案する。
本手法では,バッチ内の複数の画像の相関にアテンション機構を用いる。
本手法は,訓練時間を大幅に短縮し,最先端の手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2024-02-29T15:05:11Z) - Regressing Transformers for Data-efficient Visual Place Recognition [10.156432076272475]
この研究は、レグレッション問題としての場所認識をフレーミングすることで、新しい視点を導入する。
画像ディスクリプタをグレード付き類似ラベルと直接整合するように最適化することにより、高価な再ランク付けなしでランキング機能を向上させる。
論文 参考訳(メタデータ) (2024-01-29T17:04:32Z) - Self-Supervised Feature Learning for Long-Term Metric Visual
Localization [16.987148593917905]
本稿では,メトリクスの視覚的ローカライゼーションのための新しい自己教師型特徴学習フレームワークを提案する。
提案手法は, 画像照合アルゴリズムを用いて, 基底構造ラベルを使わずに画像対応を生成する。
次に、画像ペアをサンプリングして、深層ニューラルネットワークをトレーニングし、関連する記述子とスコアのスパースな特徴を学習する。
論文 参考訳(メタデータ) (2022-11-30T21:15:05Z) - Investigating the Role of Image Retrieval for Visual Localization -- An
exhaustive benchmark [46.166955777187816]
本稿では,複数の視覚的ローカライゼーションパラダイムにおける画像検索の役割を理解することに焦点を当てる。
本稿では、新しいベンチマーク設定を導入し、複数のデータセットにおける最先端の検索表現を比較した。
これらのツールと奥行き分析を用いて、古典的ランドマーク検索や位置認識タスクにおける検索性能は、ローカライズ性能に限らず、すべてのパラダイムで相関していることを示す。
論文 参考訳(メタデータ) (2022-05-31T12:59:01Z) - Attribute Prototype Network for Any-Shot Learning [113.50220968583353]
属性ローカライズ機能を統合した画像表現は、任意のショット、すなわちゼロショットと少数ショットのイメージ分類タスクに有用である、と我々は主張する。
クラスレベルの属性のみを用いてグローバルな特徴とローカルな特徴を共同で学習する新しい表現学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-04-04T02:25:40Z) - Kinship Verification Based on Cross-Generation Feature Interaction
Learning [53.62256887837659]
顔画像からの血縁検証は、コンピュータビジョンの応用において、新しいが挑戦的な技術として認識されている。
本稿では,頑健な親族関係検証のためのクロスジェネレーション・インタラクション・ラーニング(CFIL)フレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-07T01:50:50Z) - Deep Metric Learning for Ground Images [4.864819846886142]
我々は,現在のロボットの位置決めについて事前の知識がない初期位置決めタスクに対処する。
本稿では,クエリ画像に最もよく似た参照画像を取得するディープメトリック学習手法を提案する。
地上画像の既存の画像検索手法とは対照的に,提案手法はリコール性能が大幅に向上し,最先端のテクスチャベースローカライゼーション手法のローカライズ性能が向上する。
論文 参考訳(メタデータ) (2021-09-03T14:43:59Z) - Cross-Descriptor Visual Localization and Mapping [81.16435356103133]
視覚のローカライゼーションとマッピングは、Mixed Realityとロボティクスシステムの大部分を支える重要な技術である。
特徴表現の連続的な更新を必要とする局所化とマッピングのための3つの新しいシナリオを提案する。
我々のデータ駆動型アプローチは特徴記述子型に非依存であり、計算要求が低く、記述アルゴリズムの数と線形にスケールする。
論文 参考訳(メタデータ) (2020-12-02T18:19:51Z) - Benchmarking Image Retrieval for Visual Localization [41.38065116577011]
視覚的ローカライゼーションは、自律運転や拡張現実といったテクノロジーの中核的なコンポーネントである。
これらのタスクには最先端の画像検索アルゴリズムを用いるのが一般的である。
本稿では,複数の視覚的ローカライゼーションタスクにおける画像検索の役割を理解することに焦点を当てる。
論文 参考訳(メタデータ) (2020-11-24T07:59:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。