論文の概要: Hyperdimensional computing as a framework for systematic aggregation of
image descriptors
- arxiv url: http://arxiv.org/abs/2101.07720v1
- Date: Tue, 19 Jan 2021 16:49:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-22 11:13:18.770869
- Title: Hyperdimensional computing as a framework for systematic aggregation of
image descriptors
- Title(参考訳): 画像記述子の体系的アグリゲーションの枠組みとしての超次元計算
- Authors: Peer Neubert and Stefan Schubert
- Abstract要約: 我々は超次元計算(HDC)を、同じ次元の1つのベクトルにおけるベクトルの集合からの情報を組み合わせるアプローチとして用いている。
本稿では,既存および将来の画像記述子(深層学習ベース)の出力処理に適したhdc実装を提案する。
- 参考スコア(独自算出の注目度): 4.56877715768796
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image and video descriptors are an omnipresent tool in computer vision and
its application fields like mobile robotics. Many hand-crafted and in
particular learned image descriptors are numerical vectors with a potentially
(very) large number of dimensions. Practical considerations like memory
consumption or time for comparisons call for the creation of compact
representations. In this paper, we use hyperdimensional computing (HDC) as an
approach to systematically combine information from a set of vectors in a
single vector of the same dimensionality. HDC is a known technique to perform
symbolic processing with distributed representation in numerical vectors with
thousands of dimensions. We present a HDC implementation that is suitable for
processing the output of existing and future (deep-learning based) image
descriptors. We discuss how this can be used as a framework to process
descriptors together with additional knowledge by simple and fast vector
operations. A concrete outcome is a novel HDC-based approach to aggregate a set
of local image descriptors together with their image positions in a single
holistic descriptor. The comparison to available holistic descriptors and
aggregation methods on a series of standard mobile robotics place recognition
experiments shows a 20% improvement in average performance compared to
runner-up and 3.6x better worst-case performance.
- Abstract(参考訳): 画像とビデオのディスクリプタは、コンピュータビジョンとそのモバイルロボティクスなどの応用分野において、一貫したツールである。
手作りで特に学習された画像記述子の多くは、潜在的に(非常に)多くの次元を持つ数値ベクトルである。
メモリ消費や比較時間といった実践的な考慮事項は、コンパクトな表現の作成を要求する。
本稿では,一組のベクトルから得られる情報を同一次元のベクトルに体系的に結合する手法として,超次元計算(HDC)を用いる。
HDCは、数千次元の数値ベクトルで分散表現を用いた記号処理を行うための既知の技術である。
本稿では,既存および将来の画像記述子(深層学習ベース)の出力処理に適したhdc実装を提案する。
簡単なベクトル演算による追加知識とともに記述子を処理するためのフレームワークとしてどのように使用できるかについて議論する。
具体的な結果は、局所的な画像記述子の集合を1つの全体的記述子のイメージ位置とともに集約する、HDCベースの新しいアプローチである。
一連の標準的な移動ロボットの配置認識実験で利用可能な総体的記述子と集約法と比較すると、ランナーアップと3.6倍の最悪のパフォーマンスに比べて平均性能が20%向上している。
関連論文リスト
- Neural Clustering based Visual Representation Learning [61.72646814537163]
クラスタリングは、機械学習とデータ分析における最も古典的なアプローチの1つである。
本稿では,特徴抽出をデータから代表者を選択するプロセスとみなすクラスタリング(FEC)による特徴抽出を提案する。
FECは、個々のクラスタにピクセルをグループ化して抽象的な代表を配置し、現在の代表とピクセルの深い特徴を更新する。
論文 参考訳(メタデータ) (2024-03-26T06:04:50Z) - Residual Learning for Image Point Descriptors [56.917951170421894]
本稿では,手作りの検出器とディスクリプタを用いて局所画像記述子を学習する,非常にシンプルで効果的な手法を提案する。
我々は,手書き記述子にすでに存在する知識を活用することで,最終記述子を最適化する。
本手法は,非微分関数を用いたアンサンブル学習や学習に応用できる可能性がある。
論文 参考訳(メタデータ) (2023-12-24T12:51:30Z) - Fast and Efficient Scene Categorization for Autonomous Driving using
VAEs [2.694218293356451]
シーン分類は、高度なコンピュータビジョンタスクの事前知識を提供する有用な前駆的タスクである。
画像から粗い特徴を捉えるグローバルな記述子を生成し、分類ヘッドを用いて記述子を3つのシーン(農村、都市、郊外)にマップする。
提案するグローバルディスクリプタは非常にコンパクトで、埋め込み長は128であり、計算がかなり高速で、季節や不純物の変化に対して堅牢である。
論文 参考訳(メタデータ) (2022-10-26T18:50:15Z) - Learning-Based Dimensionality Reduction for Computing Compact and
Effective Local Feature Descriptors [101.62384271200169]
特徴の形でのイメージパッチの独特な表現は多くのコンピュータビジョンとロボティクスのタスクの重要な構成要素である。
マルチ層パーセプトロン(MLP)を用いて,低次元ながら高品質な記述子を抽出する。
視覚的ローカライゼーション、パッチ検証、画像マッチング、検索など、さまざまなアプリケーションについて検討する。
論文 参考訳(メタデータ) (2022-09-27T17:59:04Z) - Efficient Multiscale Object-based Superpixel Framework [62.48475585798724]
我々は,SICLE(Iterative CLEarcutting)によるスーパーピクセルという,新しいスーパーピクセルフレームワークを提案する。
SICLEは、複数スケールのセグメンテーションをオンザフライで生成できるオブジェクト情報を利用する。
これは最近のスーパーピクセル法を一般化し、複数のデライン化指標に従って効率と効率性に関する最先端のアプローチを超越している。
論文 参考訳(メタデータ) (2022-04-07T15:59:38Z) - ZippyPoint: Fast Interest Point Detection, Description, and Matching
through Mixed Precision Discretization [71.91942002659795]
我々は,ネットワーク量子化技術を用いて推論を高速化し,計算限定プラットフォームでの利用を可能にする。
バイナリディスクリプタを用いた効率的な量子化ネットワークZippyPointは,ネットワーク実行速度,ディスクリプタマッチング速度,3Dモデルサイズを改善する。
これらの改善は、ホモグラフィー推定、視覚的ローカライゼーション、マップフリーな視覚的再ローカライゼーションのタスクで評価されるように、小さなパフォーマンス劣化をもたらす。
論文 参考訳(メタデータ) (2022-03-07T18:59:03Z) - Efficient Scene Compression for Visual-based Localization [5.575448433529451]
3D再構成やシーン表現に関してカメラのポーズを推定することは、多くの複合現実とロボティクスアプリケーションにとって重要なステップである。
本研究では,制約付き二次プログラム(QP)を用いてシーン表現を圧縮する新しい手法を提案する。
公開データセットを用いた実験により,提案手法はシーン表現を高速に圧縮し,正確なポーズ推定を行うことを示す。
論文 参考訳(メタデータ) (2020-11-27T18:36:06Z) - Learning Feature Descriptors using Camera Pose Supervision [101.56783569070221]
本稿では,画像間の相対的なカメラポーズからのみ特徴記述子を学習可能な,弱教師付きフレームワークを提案する。
ピクセルレベルの地上通信はもはや不要なので、我々のフレームワークは、より大きく、より多様なデータセットのトレーニングを、より良い、偏見のない記述子に開放する。
論文 参考訳(メタデータ) (2020-04-28T06:35:27Z) - Texture Classification using Block Intensity and Gradient Difference
(BIGD) Descriptor [18.51387789714017]
ブロック強度と勾配差(BIGD)という,効率的で独特な局所記述子を提案する。
画像パッチでは、複数スケールのブロックペアをランダムにサンプリングし、ペアのブロックの強度と勾配の差を利用して局所的なBIGD記述子を構築する。
実験結果から, 識別力の強いBIGDディスクリプタは, 最先端テクスチャディスクリプタよりも0.12%, 6.43%高い分類精度が得られた。
論文 参考訳(メタデータ) (2020-02-04T07:03:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。