論文の概要: Learning-Based Dimensionality Reduction for Computing Compact and
Effective Local Feature Descriptors
- arxiv url: http://arxiv.org/abs/2209.13586v1
- Date: Tue, 27 Sep 2022 17:59:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 16:27:16.060192
- Title: Learning-Based Dimensionality Reduction for Computing Compact and
Effective Local Feature Descriptors
- Title(参考訳): コンパクトかつ効果的な局所特徴記述子計算のための学習に基づく次元化
- Authors: Hao Dong, Xieyuanli Chen, Mihai Dusmanu, Viktor Larsson, Marc
Pollefeys and Cyrill Stachniss
- Abstract要約: 特徴の形でのイメージパッチの独特な表現は多くのコンピュータビジョンとロボティクスのタスクの重要な構成要素である。
マルチ層パーセプトロン(MLP)を用いて,低次元ながら高品質な記述子を抽出する。
視覚的ローカライゼーション、パッチ検証、画像マッチング、検索など、さまざまなアプリケーションについて検討する。
- 参考スコア(独自算出の注目度): 101.62384271200169
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A distinctive representation of image patches in form of features is a key
component of many computer vision and robotics tasks, such as image matching,
image retrieval, and visual localization. State-of-the-art descriptors, from
hand-crafted descriptors such as SIFT to learned ones such as HardNet, are
usually high dimensional; 128 dimensions or even more. The higher the
dimensionality, the larger the memory consumption and computational time for
approaches using such descriptors. In this paper, we investigate multi-layer
perceptrons (MLPs) to extract low-dimensional but high-quality descriptors. We
thoroughly analyze our method in unsupervised, self-supervised, and supervised
settings, and evaluate the dimensionality reduction results on four
representative descriptors. We consider different applications, including
visual localization, patch verification, image matching and retrieval. The
experiments show that our lightweight MLPs achieve better dimensionality
reduction than PCA. The lower-dimensional descriptors generated by our approach
outperform the original higher-dimensional descriptors in downstream tasks,
especially for the hand-crafted ones. The code will be available at
https://github.com/PRBonn/descriptor-dr.
- Abstract(参考訳): 特徴の形でのイメージパッチの独特な表現は、画像マッチング、画像検索、視覚的ローカライゼーションといった多くのコンピュータビジョンとロボティクスタスクの重要な要素である。
SIFTのような手作りの記述子からHardNetのような学習した記述子まで、最先端の記述子は通常高次元であり、128次元以上である。
次元が大きくなるほど、そのような記述子を用いたアプローチのメモリ消費と計算時間が大きくなる。
本稿では,低次元ながら高品質な記述子を抽出する多層パーセプトロン(MLP)について検討する。
提案手法を教師なし,自己管理,教師付き設定で徹底的に解析し,4つの代表記述子について次元削減結果を評価する。
視覚的ローカライゼーション,パッチ検証,画像マッチング,検索など,さまざまなアプリケーションを検討した。
実験の結果,PCAよりも軽量なMLPの方が次元の低減に優れることがわかった。
提案手法により生成する低次元記述子は, 下流タスク, 特に手作り作業において, 元の高次元記述子を上回っている。
コードはhttps://github.com/prbonn/descriptor-drで入手できる。
関連論文リスト
- Parameter-Inverted Image Pyramid Networks [49.35689698870247]
Inverted Image Pyramid Networks (PIIP) と呼ばれる新しいネットワークアーキテクチャを提案する。
私たちの中核となる考え方は、パラメータサイズの異なるモデルを使用して、画像ピラミッドの解像度の異なるレベルを処理することです。
PIIPは、オブジェクト検出、セグメンテーション、画像分類などのタスクにおいて優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-06-06T17:59:10Z) - Residual Learning for Image Point Descriptors [56.917951170421894]
本稿では,手作りの検出器とディスクリプタを用いて局所画像記述子を学習する,非常にシンプルで効果的な手法を提案する。
我々は,手書き記述子にすでに存在する知識を活用することで,最終記述子を最適化する。
本手法は,非微分関数を用いたアンサンブル学習や学習に応用できる可能性がある。
論文 参考訳(メタデータ) (2023-12-24T12:51:30Z) - ALIKED: A Lighter Keypoint and Descriptor Extraction Network via
Deformable Transformation [27.04762347838776]
本稿では,各キーポイントに対するサポート機能の変形可能な位置を学習し,変形可能な記述子を構成するSparse Deformable Descriptor Head (SDDH)を提案する。
提案するネットワークは,画像マッチング,3次元再構成,視覚的再局在化など,様々な視覚計測タスクにおいて効率的かつ強力であることを示す。
論文 参考訳(メタデータ) (2023-04-07T12:05:39Z) - ZippyPoint: Fast Interest Point Detection, Description, and Matching
through Mixed Precision Discretization [71.91942002659795]
我々は,ネットワーク量子化技術を用いて推論を高速化し,計算限定プラットフォームでの利用を可能にする。
バイナリディスクリプタを用いた効率的な量子化ネットワークZippyPointは,ネットワーク実行速度,ディスクリプタマッチング速度,3Dモデルサイズを改善する。
これらの改善は、ホモグラフィー推定、視覚的ローカライゼーション、マップフリーな視覚的再ローカライゼーションのタスクで評価されるように、小さなパフォーマンス劣化をもたらす。
論文 参考訳(メタデータ) (2022-03-07T18:59:03Z) - Local Quadruple Pattern: A Novel Descriptor for Facial Image Recognition
and Retrieval [20.77994516381]
顔画像の認識と検索のために手作りの局所四重項パターン(LQPAT)を提案する。
提案された記述子は、四重空間における隣人間の関係を符号化する。
提案するデクリプタの検索と認識精度を,ベンチマークデータベース上の手作りデクリプタの状態と比較した。
論文 参考訳(メタデータ) (2022-01-03T08:04:38Z) - The Intrinsic Dimension of Images and Its Impact on Learning [60.811039723427676]
自然画像データは従来の画素表現の高次元にもかかわらず低次元構造を示すと広く信じられている。
本研究では,一般的なデータセットに次元推定ツールを適用し,深層学習における低次元構造の役割を検討する。
論文 参考訳(メタデータ) (2021-04-18T16:29:23Z) - Hyperdimensional computing as a framework for systematic aggregation of
image descriptors [4.56877715768796]
我々は超次元計算(HDC)を、同じ次元の1つのベクトルにおけるベクトルの集合からの情報を組み合わせるアプローチとして用いている。
本稿では,既存および将来の画像記述子(深層学習ベース)の出力処理に適したhdc実装を提案する。
論文 参考訳(メタデータ) (2021-01-19T16:49:58Z) - Learning Feature Descriptors using Camera Pose Supervision [101.56783569070221]
本稿では,画像間の相対的なカメラポーズからのみ特徴記述子を学習可能な,弱教師付きフレームワークを提案する。
ピクセルレベルの地上通信はもはや不要なので、我々のフレームワークは、より大きく、より多様なデータセットのトレーニングを、より良い、偏見のない記述子に開放する。
論文 参考訳(メタデータ) (2020-04-28T06:35:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。