論文の概要: SuperGF: Unifying Local and Global Features for Visual Localization
- arxiv url: http://arxiv.org/abs/2212.13105v1
- Date: Fri, 23 Dec 2022 13:48:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-27 14:41:25.096734
- Title: SuperGF: Unifying Local and Global Features for Visual Localization
- Title(参考訳): SuperGF:ビジュアルローカライゼーションのためのローカル機能とグローバル機能の統合
- Authors: Wenzheng Song, Ran Yan, Boshu Lei, Takayuki Okatani
- Abstract要約: SuperGFは、画像マッチング固有のローカル機能を直接操作するトランスフォーマーベースの集約モデルである。
我々は,高密度でスパースな学習ベースや手作りの記述子など,様々なローカル特徴を用いたSuperGFの実装を提供する。
- 参考スコア(独自算出の注目度): 13.869227429939423
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Advanced visual localization techniques encompass image retrieval challenges
and 6 Degree-of-Freedom (DoF) camera pose estimation, such as hierarchical
localization. Thus, they must extract global and local features from input
images. Previous methods have achieved this through resource-intensive or
accuracy-reducing means, such as combinatorial pipelines or multi-task
distillation. In this study, we present a novel method called SuperGF, which
effectively unifies local and global features for visual localization, leading
to a higher trade-off between localization accuracy and computational
efficiency. Specifically, SuperGF is a transformer-based aggregation model that
operates directly on image-matching-specific local features and generates
global features for retrieval. We conduct experimental evaluations of our
method in terms of both accuracy and efficiency, demonstrating its advantages
over other methods. We also provide implementations of SuperGF using various
types of local features, including dense and sparse learning-based or
hand-crafted descriptors.
- Abstract(参考訳): 高度な視覚的ローカライゼーション技術は、画像検索の課題と、階層的ローカライゼーションのような6自由度カメラのポーズ推定を含む。
したがって、入力画像からグローバルおよびローカルな特徴を抽出する必要がある。
従来は、組み合わせパイプラインやマルチタスク蒸留など、資源集約的あるいは精度の低下手段によって実現されてきた。
本研究では,視覚的局所化のための局所的特徴とグローバルな特徴を効果的に統一し,局所化精度と計算効率のトレードオフを高めるSuperGFという手法を提案する。
具体的には、SuperGFは、画像マッチング固有の局所的特徴を直接操作し、検索のためのグローバルな特徴を生成するトランスフォーマーベースの集約モデルである。
提案手法の精度と効率の両面から実験的評価を行い,他の手法に対する利点を実証した。
また,高密度でスパースな学習ベースや手作りの記述子など,様々なローカル特徴を用いたSuperGFの実装も提供する。
関連論文リスト
- Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - GLFF: Global and Local Feature Fusion for AI-synthesized Image Detection [29.118321046339656]
画像全体から複数スケールのグローバルな特徴と、AI合成画像検出のための情報パッチからの洗練されたローカル特徴を組み合わせることで、リッチで差別的な表現を学習するフレームワークを提案する。
GLFFは、マルチスケールの意味的特徴を抽出するグローバルブランチと、詳細なローカルアーティファクト抽出のための情報パッチを選択するローカルブランチの2つのブランチから情報を抽出する。
論文 参考訳(メタデータ) (2022-11-16T02:03:20Z) - RING++: Roto-translation Invariant Gram for Global Localization on a
Sparse Scan Map [20.276334172402763]
本稿では、位置認識のためのロト変換不変表現と、回転と翻訳の両方のグローバル収束を持つRing++を提案する。
理論的保証により、RING++はスパーススキャン付き軽量マップを使用して、大きな視点差に対処することができる。
これはスパーススキャンマップにおけるグローバルローカライゼーションのすべてのサブタスクに対処する初めての学習不要フレームワークである。
論文 参考訳(メタデータ) (2022-10-12T07:49:24Z) - Centralized Feature Pyramid for Object Detection [53.501796194901964]
視覚的特徴ピラミッドは、広範囲のアプリケーションにおいて、有効性と効率の両方において、その優位性を示している。
本稿では,オブジェクト検出のためのOLO特徴ピラミッドを提案する。
論文 参考訳(メタデータ) (2022-10-05T08:32:54Z) - SphereVLAD++: Attention-based and Signal-enhanced Viewpoint Invariant
Descriptor [6.326554177747699]
SphereVLAD++ は注目度が高められた視点不変位置認識手法である。
SphereVLAD++は、小さな視点や完全に逆の視点差の下で、最先端の3D位置認識手法をすべて上回ることを示す。
論文 参考訳(メタデータ) (2022-07-06T20:32:43Z) - Conformer: Local Features Coupling Global Representations for Visual
Recognition [72.9550481476101]
本稿では,畳み込み操作と自己アテンション機構を利用した表現学習のためのハイブリッドネットワーク構造,conformerを提案する。
実験では、コンフォーマーが同等のパラメータ複雑性の下で視覚変換器(DeiT-B)を2.3%上回ることが示されている。
論文 参考訳(メタデータ) (2021-05-09T10:00:03Z) - PGL: Prior-Guided Local Self-supervised Learning for 3D Medical Image
Segmentation [87.50205728818601]
本稿では,潜在特徴空間における局所的一貫性を学習するPGL(PresideedGuided Local)自己教師モデルを提案する。
我々のPGLモデルは、局所領域の特異な表現を学習し、したがって構造情報を保持できる。
論文 参考訳(メタデータ) (2020-11-25T11:03:11Z) - Gait Recognition via Effective Global-Local Feature Representation and
Local Temporal Aggregation [28.721376937882958]
歩行認識は最も重要な生体計測技術の一つであり、多くの分野で応用されている。
近年の歩行認識フレームワークは、人間のグローバルな外観または地域から抽出された記述子によって各歩行フレームを表現している。
歩行認識のための識別的特徴表現を実現するための新しい特徴抽出・融合フレームワークを提案する。
論文 参考訳(メタデータ) (2020-11-03T04:07:13Z) - Inter-Image Communication for Weakly Supervised Localization [77.2171924626778]
弱教師付きローカライゼーションは、画像レベルの監督のみを使用して対象対象領域を見つけることを目的としている。
我々は,より正確な物体位置を学習するために,異なる物体間の画素レベルの類似性を活用することを提案する。
ILSVRC検証セット上でトップ1のローカライズ誤差率45.17%を達成する。
論文 参考訳(メタデータ) (2020-08-12T04:14:11Z) - Multi-View Optimization of Local Feature Geometry [70.18863787469805]
本研究では,複数視点からの局所像の特徴の幾何を,未知のシーンやカメラの幾何を伴わずに精査する問題に対処する。
提案手法は,従来の特徴抽出とマッチングのパラダイムを自然に補完する。
本手法は,手作りと学習の両方の局所的特徴に対して,三角測量とカメラのローカライゼーション性能を常に向上することを示す。
論文 参考訳(メタデータ) (2020-03-18T17:22:11Z) - Features for Ground Texture Based Localization -- A Survey [12.160708336715489]
特徴量に基づく地盤テクスチャに基づく車両位置決めは,インフラストラクチャフリーな高精度な位置決めを実現する上で有望な手法である。
本研究は,画像ペアと合成変換を別々に行い,利用可能な特徴抽出手法を初めて広範囲に評価するものである。
我々は、AkaZE、SURF、CenSurEを最高のキーポイント検出器として同定し、CenSurEとORB、BRIEF、LATCHの特徴記述子をペアリングして、インクリメンタルなローカライゼーションで最大の成功率を達成する。
論文 参考訳(メタデータ) (2020-02-27T07:25:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。